Conjunto de datos en árabe, tailandés, vietnamita, hindi, inglés y chino
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 150k
Anotación: Sí
Descripción: Conjunto de datos en árabe, tailandés, vietnamita, hindi, inglés y chino
Conjunto de datos de texto en árabe
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 1k
Anotación: Sí
Descripción: El conjunto de datos de texto árabe contiene una colección de muestras de texto escritas en árabe. Incluye varios formatos de contenido, como artículos de noticias, publicaciones en redes sociales, literatura y diálogos, que abarcan diferentes temas y estilos de escritura. Este conjunto de datos se utiliza para tareas como procesamiento del lenguaje natural (PLN), clasificación de texto, análisis de sentimientos y traducción automática en aplicaciones de idioma árabe.
Conjunto de datos de los idiomas chino, inglés, tibetano y uigur
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 38k
Anotación: Sí
Descripción: Conjunto de datos de los idiomas chino, inglés, tibetano y uigur
Conjunto de datos de menú en chino e inglés
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 60k
Anotación: Sí
Descripción: El conjunto de datos de menú en chino e inglés contiene imágenes o muestras de texto de menús de restaurantes que incluyen tanto el chino como el inglés. Incluye varias fuentes, diseños y estructuras de menú, y presenta nombres de platos, descripciones y precios bilingües. Este conjunto de datos es útil para tareas como el reconocimiento óptico de caracteres (OCR), la traducción automática y la digitalización de menús en entornos multilingües.
Conjunto de datos de composiciones manuscritas en chino
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 3k
Anotación: Sí
Descripción: El conjunto de datos de composiciones manuscritas en chino contiene muestras de textos escritos a mano en chino, incluidas composiciones, ensayos y otros textos extensos. Incluye varios estilos de escritura a mano y niveles de complejidad, y se utiliza para tareas como reconocimiento de escritura a mano, análisis de texto y entrenamiento de modelos de aprendizaje automático.
Conjunto de datos de avisos de Wi-Fi chinos
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 1k
Anotación: Sí
Descripción: El conjunto de datos de indicaciones de WIFI en chino consta de muestras de texto que se encuentran en indicaciones de WIFI y pantallas de inicio de sesión escritas en chino. Por lo general, incluye varias indicaciones, instrucciones y mensajes de error relacionados con la conexión o la gestión de redes WIFI. Este conjunto de datos se utiliza para tareas como el reconocimiento de texto, el procesamiento del lenguaje natural y la mejora de las interfaces de usuario para la conectividad de red.
Conjunto de datos de escritura a mano en inglés y chino
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 12k
Anotación: Sí
Descripción: El conjunto de datos de escritura a mano en inglés y chino contiene muestras escritas a mano en inglés y chino, que muestran distintos estilos de escritura y complejidades de caracteres. Se utiliza normalmente para entrenar y evaluar modelos de reconocimiento de escritura a mano, respaldar el análisis de textos multilingües y otras investigaciones relacionadas. El conjunto de datos incluye una amplia gama de caracteres, dígitos, palabras y oraciones en ambos idiomas.
Conjunto de datos de letreros comerciales en inglés y chino
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 30k
Anotación: Sí
Descripción: El conjunto de datos de letreros comerciales en inglés y chino incluye imágenes de letreros comerciales que presentan texto en inglés y chino. Captura varios elementos de señalización, como nombres de tiendas, anuncios, promociones e indicaciones, que se muestran en diversas fuentes, estilos y formatos. Este conjunto de datos se utiliza para tareas como la detección y el reconocimiento de texto, la comprensión de escenas multilingües y la mejora de los modelos de visión artificial para interpretar la señalización bilingüe.
Conjunto de datos de texto con ángulos especiales en inglés y chino
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 50k
Anotación: Sí
Descripción: El conjunto de datos de texto en ángulos especiales en inglés y chino contiene imágenes de texto que se muestran en varios ángulos y orientaciones tanto en inglés como en chino. Incluye texto de fuentes como carteles, anuncios y documentos que no se presentan en formatos horizontales estándar. Este conjunto de datos se utiliza para entrenar y evaluar modelos de detección y reconocimiento de texto, en particular aquellos capaces de manejar texto en orientaciones y perspectivas no tradicionales.
Conjunto de datos del menú en inglés
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 20k
Anotación: Sí
Descripción: El conjunto de datos de menú en inglés incluye imágenes o muestras de texto de menús de restaurantes escritos en inglés. Incluye una variedad de fuentes, diseños y estilos de formato, con contenido que abarca desde nombres de platos hasta descripciones y precios. Este conjunto de datos se utiliza a menudo para tareas como reconocimiento óptico de caracteres (OCR), extracción de texto y digitalización de menús en aplicaciones relacionadas con la comida.
Conjunto de datos de texto de escenas en inglés
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 33k
Anotación: Sí
Descripción: El conjunto de datos de texto de escenas en inglés consta de imágenes que contienen escenas naturales con texto en inglés incorporado. El texto aparece en diversas formas, como letreros, vallas publicitarias y carteles, a menudo en distintas fuentes, tamaños y orientaciones. Este conjunto de datos se utiliza habitualmente para entrenar y probar modelos en tareas de detección, reconocimiento y comprensión de escenas de texto.
Conjunto de datos de texto escrito a mano
Caso de uso: Documento IA
Formato: HEIC (imágenes) y .mov (videos)
Contar: 94053
Anotación: No
Descripción: Fotos en vivo con texto escrito a mano para japonés, coreano y ruso
Dispositivo de grabación: Cámara de iPhone y iPad
Condición de grabación: - Iluminación/deslumbramiento agresivo - Flash de la cámara encendido - Luz de color - Poca luz, sin flash de la cámara - Normal
Conjunto de datos en idioma japonés y coreano
Cuadro delimitador + Texto
Caso de uso: OCR
Formato: Imagen
Contar: 40k
Anotación: Sí
Descripción: El conjunto de datos de los idiomas japonés y coreano incluye muestras de texto tanto en japonés como en coreano. Incluye una variedad de contenido, como oraciones, frases y palabras, que abarcan varios contextos y estilos. Este conjunto de datos se utiliza para tareas como el procesamiento del lenguaje natural (PLN), la traducción automática y el análisis de texto en aplicaciones multilingües.