Visión por computador

Más de 22 conjuntos de datos de código abierto más buscados para visión artificial

Un algoritmo de IA es tan bueno como los datos que le proporcionas.

No es una declaración audaz ni poco convencional. La IA podría haber parecido bastante descabellada hace un par de décadas, pero la inteligencia artificial y el aprendizaje automático han recorrido un largo camino desde entonces.

Visión por computador ayuda a las computadoras a comprender e interpretar etiquetas e imágenes. Cuando entrena a su computadora con el tipo correcto de imágenes, puede obtener la capacidad de detectar, comprender e identificar diversas características faciales, detectar enfermedades, conducir vehículos autónomos y también salvar vidas mediante el escaneo multidimensional de órganos.

Se prevé que el mercado de Visión por computadora alcance $ 144.46 Mil Millones para 2028 de un modesto $7.04 mil millones en 2020, creciendo a una CAGR de 45.64% entre 2021 y 2028.

Algunos de los casos de uso de la visión artificial son:

  • Imagenes medicas
  • Vehículo autónomo
  • Reconocimiento facial y de objetos
  • Identificación de defectos
  • Detección de escena

El conjunto de datos de imagen está alimentando y entrenando sus tareas de aprendizaje automático y visión por computadora son cruciales para el éxito de su proyecto de IA. Un conjunto de datos de calidad es bastante difícil de obtener. Dependiendo de la complejidad de su proyecto, podría tomar entre unos días y algunas semanas obtener conjuntos de datos confiables y relevantes para fines de visión por computadora.

Aquí, le proporcionamos una gama (categorizada para su comodidad) de conjuntos de datos de código abierto que puede usar de inmediato.

Lista completa de conjuntos de datos de visión artificial

General:

  1. ImagenNet (Link)

    ImageNet es un conjunto de datos ampliamente utilizado y viene con la asombrosa cantidad de 1.2 millones de imágenes clasificadas en 1000 categorías. Este conjunto de datos está organizado según la jerarquía de WorldNet y se clasifica en tres partes: datos de entrenamiento, etiquetas de imágenes y datos de validación.

  2. Cinética 700 (Link)

    Kinetics 700 es un enorme conjunto de datos de alta calidad con más de 650,000 700 clips de 700 clases diferentes de acción humana. Cada una de las acciones de clase tiene alrededor de XNUMX videoclips. Los clips en el conjunto de datos tienen interacciones humano-objeto y humano-humano, que están demostrando ser muy útiles para reconocer acciones humanas en videos.

  3. CIFAR-10 (Link)

    CIFAR 10 es uno de los conjuntos de datos de visión por computadora más grandes que cuenta con 60000 imágenes en color de 32 x 32 que representan diez clases diferentes. Cada clase tiene alrededor de 6000 imágenes que se utilizan para entrenar algoritmos de visión por computadora y aprendizaje automático.

Reconocimiento facial:

Reconocimiento facial

  1. Rostros etiquetados en la naturaleza (Link)

    Labeled Faced in the Wild es un enorme conjunto de datos que contiene más de 13,230 imágenes de casi 5,750 personas detectadas en Internet. Este conjunto de datos de rostros está diseñado para facilitar el estudio de la detección de rostros sin restricciones.

  2. Cara web de CASIA (Link)

    CASIA Web face es un conjunto de datos bien diseñado que ayuda al aprendizaje automático y la investigación científica sobre el reconocimiento facial sin restricciones. Con más de 494,000 imágenes de casi 10,000 identidades reales, es ideal para tareas de identificación y verificación de rostros.

  3. Conjunto de datos de rostros UMD (Link)

    UMD se enfrenta a un conjunto de datos bien anotado que contiene dos partes: imágenes fijas y fotogramas de vídeo. El conjunto de datos tiene más de 367,800 anotaciones faciales y 3.7 millones de fotogramas de video anotados de sujetos.

Reconocimiento de escritura a mano:

  1. Base de datos MNIST (Link)

    MNIST es una base de datos que contiene muestras de dígitos escritos a mano del 0 al 9, y tiene 60,000 y 10,000 imágenes de entrenamiento y prueba. Lanzado en 1999, MNIST facilita la prueba de sistemas de procesamiento de imágenes en Deep Learning.

  2. Conjunto de datos de caracteres artificiales (Link)

    El conjunto de datos de caracteres artificiales es, como su nombre indica, datos generados artificialmente que describen la estructura del idioma inglés en diez letras mayúsculas. Viene con más de 6000 imágenes.

Analicemos hoy sus requisitos de datos de entrenamiento de IA.

Detección de objetos:

  1. MS COCO (Link)

    MS COCO u Objetos comunes en contexto es un conjunto de datos de subtítulos y detección de objetos.

    Tiene más de 328,000 imágenes con detección de puntos clave, detección de múltiples objetos, subtítulos y anotaciones de máscara de segmentación. Viene con 80 categorías de objetos y cinco leyendas por imagen.

  2. LSUN(Link)

    LSUN, abreviatura de Comprensión de escenas a gran escala, tiene más de un millón de imágenes etiquetadas en 20 categorías de objetos y 10 de escenas. Algunas categorías tienen cerca de 300,000 300 imágenes, con 1000 imágenes específicas para validación y XNUMX imágenes para datos de prueba.

  3. Objetos de inicio(Link)

    El conjunto de datos de Home Objects contiene imágenes anotadas de objetos aleatorios de toda la casa: cocina, sala de estar y baño. Este conjunto de datos también tiene algunos videos anotados y 398 fotos sin anotaciones diseñadas para pruebas.

Automotor:

  1. Conjunto de datos de paisaje urbano (Link)

    Cityscape es el conjunto de datos al que acudir cuando se buscan varias secuencias de video grabadas de escenas callejeras de varias ciudades. Estas imágenes fueron capturadas durante mucho tiempo y en diferentes condiciones climáticas y de luz. Las anotaciones son para 30 clases de imágenes divididas en ocho categorías diferentes.

  2. Impulsión profunda de Barkley (Link)

    Barkley DeepDrive está diseñado específicamente para el entrenamiento de vehículos autónomos y cuenta con más de 100 mil secuencias de video anotadas. Es uno de los datos de entrenamiento más útiles para vehículos autónomos por las condiciones cambiantes de la carretera y la conducción.

  3. mapillary (Link)

    Mapillary tiene más de 750 millones de escenas de calles y señales de tráfico en todo el mundo, lo que es muy útil para entrenar modelos de percepción visual en aprendizaje automático y algoritmos de IA. Le permite desarrollar vehículos autónomos que se adaptan a diversas condiciones climáticas y de iluminación y puntos de vista.

Imagenes medicas:

  1. Conjunto de datos de investigación abierta de Covid-19 (Link)

    Este conjunto de datos original tiene alrededor de 6500 segmentaciones de pulmón poligonales de píxeles sobre radiografías de tórax AP/PA. Además, están disponibles 517 imágenes de radiografías de pacientes con Covid-19 con etiquetas que contienen el nombre, la ubicación, los detalles de admisión, el resultado y más.

  2. Base de datos NIH de 100,000 radiografías de tórax (Link)

    La base de datos del NIH es uno de los conjuntos de datos disponibles públicamente más extensos que contiene 100,000 XNUMX imágenes de radiografías de tórax y datos relacionados útiles para la comunidad científica y de investigación. Incluso tiene imágenes de pacientes con condiciones pulmonares avanzadas.

  3. Atlas de Patología Digital (Link)

    Atlas of Digital Pathology ofrece varias imágenes de parches histopatológicos, más de 17,000 100 en total, de cerca de XNUMX diapositivas anotadas de diferentes órganos. Este conjunto de datos es útil para desarrollar software de visión artificial y reconocimiento de patrones.

Reconocimiento de escena:

Reconocimiento de escena

  1. Reconocimiento de escenas en interiores (Link)

    Indoor Scene Recognition es un conjunto de datos altamente categorizado con casi 15620 imágenes de objetos y escenarios interiores que se utilizarán en el aprendizaje automático y el entrenamiento de datos. Viene con más de 65 categorías, y cada categoría tiene un mínimo de 100 imágenes.

  2. xVer (Link)

    Como uno de los conjuntos de datos disponibles públicamente más conocidos, xView contiene toneladas de imágenes aéreas anotadas de varias escenas complejas y grandes. Con alrededor de 60 clases y más de un millón de instancias de objetos, el propósito de este conjunto de datos es brindar un mejor alivio en casos de desastre utilizando imágenes satelitales.

  3. Lugares (Link)

    Places, un conjunto de datos aportado por el MIT, tiene más de 1.8 millones de imágenes de 365 categorías de escenas diferentes. Hay alrededor de 50 imágenes en cada una de estas categorías para validación y 900 imágenes para prueba. Es posible aprender características profundas de la escena para establecer tareas de reconocimiento de escena o de reconocimiento visual.

Entretenimiento:

  1. Conjunto de datos IMDB WIKI (Link)

    IMDB – Wiki es una de las bases de datos públicas más populares de rostros etiquetados adecuadamente con edad, género y nombres. También tiene cerca de 20 mil rostros de celebridades y 62 mil de Wikipedia.

  2. caras de celebridades (Link)

    Celeb Faces es una base de datos a gran escala con 200,000 imágenes comentadas de celebridades. Las imágenes vienen con ruido de fondo y variaciones de pose, lo que las hace valiosas para entrenar conjuntos de prueba en tareas de visión por computadora. Es muy beneficioso para lograr una mayor precisión en el reconocimiento facial, la edición, la localización de partes faciales y más.

Ahora que tiene una lista masiva de conjuntos de datos de imágenes de código abierto para alimentar su maquinaria de inteligencia artificial. El resultado de sus modelos de inteligencia artificial y aprendizaje automático depende principalmente de la calidad de los conjuntos de datos con los que los alimenta y entrena. Si desea que su modelo de IA arroje predicciones precisas, necesita conjuntos de datos de calidad agregados, etiquetados y etiquetados a la perfección. Para amplificar el éxito de su sistema de visión artificial, debe utilizar bases de datos de imágenes de calidad relevantes para la visión de su proyecto. Si está buscando más conjuntos de datos de este tipo Haga clic aquí

Social Share

También te puede interesar