Conjunto de datos en árabe, tailandés, vietnamita, hindi, inglés y chino

Cuadro delimitador + Texto

Conjunto de datos en árabe, tailandés, vietnamita, hindi, inglés y chino

Caso de uso: OCR

Formato: Imagen

Contar: 150k

Anotación:

X

Descripción: Conjunto de datos en árabe, tailandés, vietnamita, hindi, inglés y chino

Conjunto de datos de texto en árabe

Cuadro delimitador + Texto

Conjunto de datos de texto en árabe

Caso de uso: OCR

Formato: Imagen

Contar: 1k

Anotación:

X

Descripción: El conjunto de datos de texto árabe contiene una colección de muestras de texto escritas en árabe. Incluye varios formatos de contenido, como artículos de noticias, publicaciones en redes sociales, literatura y diálogos, que abarcan diferentes temas y estilos de escritura. Este conjunto de datos se utiliza para tareas como procesamiento del lenguaje natural (PLN), clasificación de texto, análisis de sentimientos y traducción automática en aplicaciones de idioma árabe.

Conjunto de datos de los idiomas chino, inglés, tibetano y uigur

Cuadro delimitador + Texto

Conjunto de datos de los idiomas chino, inglés, tibetano y uigur

Caso de uso: OCR

Formato: Imagen

Contar: 38k

Anotación:

X

Descripción: Conjunto de datos de los idiomas chino, inglés, tibetano y uigur

Conjunto de datos de menú en chino e inglés

Cuadro delimitador + Texto

Conjunto de datos de menú en chino e inglés

Caso de uso: OCR

Formato: Imagen

Contar: 60k

Anotación:

X

Descripción: El conjunto de datos de menú en chino e inglés contiene imágenes o muestras de texto de menús de restaurantes que incluyen tanto el chino como el inglés. Incluye varias fuentes, diseños y estructuras de menú, y presenta nombres de platos, descripciones y precios bilingües. Este conjunto de datos es útil para tareas como el reconocimiento óptico de caracteres (OCR), la traducción automática y la digitalización de menús en entornos multilingües.

Conjunto de datos de composiciones manuscritas en chino

Cuadro delimitador + Texto

Conjunto de datos de composiciones manuscritas en chino

Caso de uso: OCR

Formato: Imagen

Contar: 3k

Anotación:

X

Descripción: El conjunto de datos de composiciones manuscritas en chino contiene muestras de textos escritos a mano en chino, incluidas composiciones, ensayos y otros textos extensos. Incluye varios estilos de escritura a mano y niveles de complejidad, y se utiliza para tareas como reconocimiento de escritura a mano, análisis de texto y entrenamiento de modelos de aprendizaje automático.

Conjunto de datos de avisos de Wi-Fi chinos

Cuadro delimitador + Texto

Conjunto de datos de avisos de Wi-Fi chinos

Caso de uso: OCR

Formato: Imagen

Contar: 1k

Anotación:

X

Descripción: El conjunto de datos de indicaciones de WIFI en chino consta de muestras de texto que se encuentran en indicaciones de WIFI y pantallas de inicio de sesión escritas en chino. Por lo general, incluye varias indicaciones, instrucciones y mensajes de error relacionados con la conexión o la gestión de redes WIFI. Este conjunto de datos se utiliza para tareas como el reconocimiento de texto, el procesamiento del lenguaje natural y la mejora de las interfaces de usuario para la conectividad de red.

Conjunto de datos de escritura a mano en inglés y chino

Cuadro delimitador + Texto

Conjunto de datos de escritura a mano en inglés y chino

Caso de uso: OCR

Formato: Imagen

Contar: 12k

Anotación:

X

Descripción: El conjunto de datos de escritura a mano en inglés y chino contiene muestras escritas a mano en inglés y chino, que muestran distintos estilos de escritura y complejidades de caracteres. Se utiliza normalmente para entrenar y evaluar modelos de reconocimiento de escritura a mano, respaldar el análisis de textos multilingües y otras investigaciones relacionadas. El conjunto de datos incluye una amplia gama de caracteres, dígitos, palabras y oraciones en ambos idiomas.

Conjunto de datos de letreros comerciales en inglés y chino

Cuadro delimitador + Texto

Conjunto de datos de letreros comerciales en inglés y chino

Caso de uso: OCR

Formato: Imagen

Contar: 30k

Anotación:

X

Descripción: El conjunto de datos de letreros comerciales en inglés y chino incluye imágenes de letreros comerciales que presentan texto en inglés y chino. Captura varios elementos de señalización, como nombres de tiendas, anuncios, promociones e indicaciones, que se muestran en diversas fuentes, estilos y formatos. Este conjunto de datos se utiliza para tareas como la detección y el reconocimiento de texto, la comprensión de escenas multilingües y la mejora de los modelos de visión artificial para interpretar la señalización bilingüe.

Conjunto de datos de texto con ángulos especiales en inglés y chino

Cuadro delimitador + Texto

Conjunto de datos de texto con ángulos especiales en inglés y chino

Caso de uso: OCR

Formato: Imagen

Contar: 50k

Anotación:

X

Descripción: El conjunto de datos de texto en ángulos especiales en inglés y chino contiene imágenes de texto que se muestran en varios ángulos y orientaciones tanto en inglés como en chino. Incluye texto de fuentes como carteles, anuncios y documentos que no se presentan en formatos horizontales estándar. Este conjunto de datos se utiliza para entrenar y evaluar modelos de detección y reconocimiento de texto, en particular aquellos capaces de manejar texto en orientaciones y perspectivas no tradicionales.

Conjunto de datos del menú en inglés

Cuadro delimitador + Texto

Conjunto de datos del menú en inglés

Caso de uso: OCR

Formato: Imagen

Contar: 20k

Anotación:

X

Descripción: El conjunto de datos de menú en inglés incluye imágenes o muestras de texto de menús de restaurantes escritos en inglés. Incluye una variedad de fuentes, diseños y estilos de formato, con contenido que abarca desde nombres de platos hasta descripciones y precios. Este conjunto de datos se utiliza a menudo para tareas como reconocimiento óptico de caracteres (OCR), extracción de texto y digitalización de menús en aplicaciones relacionadas con la comida.

Conjunto de datos de texto de escenas en inglés

Cuadro delimitador + Texto

Conjunto de datos de texto de escenas en inglés

Caso de uso: OCR

Formato: Imagen

Contar: 33k

Anotación:

X

Descripción: El conjunto de datos de texto de escenas en inglés consta de imágenes que contienen escenas naturales con texto en inglés incorporado. El texto aparece en diversas formas, como letreros, vallas publicitarias y carteles, a menudo en distintas fuentes, tamaños y orientaciones. Este conjunto de datos se utiliza habitualmente para entrenar y probar modelos en tareas de detección, reconocimiento y comprensión de escenas de texto.

Conjunto de datos de texto escrito a mano

Conjunto de datos de texto escrito a mano

Caso de uso: Documento IA

Formato: HEIC (imágenes) y .mov (videos)

Contar: 94053

Anotación: No

X

Descripción: Fotos en vivo con texto escrito a mano para japonés, coreano y ruso

Dispositivo de grabación: Cámara de iPhone y iPad

Condición de grabación: - Iluminación/deslumbramiento agresivo - Flash de la cámara encendido - Luz de color - Poca luz, sin flash de la cámara - Normal

Conjunto de datos en idioma japonés y coreano

Cuadro delimitador + Texto

Conjunto de datos en idioma japonés y coreano

Caso de uso: OCR

Formato: Imagen

Contar: 40k

Anotación:

X

Descripción: El conjunto de datos de los idiomas japonés y coreano incluye muestras de texto tanto en japonés como en coreano. Incluye una variedad de contenido, como oraciones, frases y palabras, que abarcan varios contextos y estilos. Este conjunto de datos se utiliza para tareas como el procesamiento del lenguaje natural (PLN), la traducción automática y el análisis de texto en aplicaciones multilingües.