La clave para superar los obstáculos del desarrollo de la IA

Datos más fiables

Introducción

La inteligencia artificial comenzó a capturar la imaginación cuando el hombre de hojalata de “El mago de Oz” llegó a la pantalla grande en 1939, y desde entonces solo ha ganado un punto de apoyo más firme en el espíritu de la época. Sin embargo, en la aplicación, los productos de IA han pasado por ciclos regulares de auge y caída que hasta ahora han obstaculizado las adopciones más influyentes.

Durante los auges, los ingenieros e investigadores han logrado grandes avances, pero cuando sus aspiraciones superan inevitablemente las capacidades informáticas disponibles en ese momento, ha seguido un período de inactividad. Afortunadamente, el aumento exponencial de la potencia de cálculo profetizado por la Ley de Moore en 1965 ha demostrado ser exacto en su mayor parte, y es difícil exagerar la importancia de este aumento.

Obstáculos para el desarrollo de la IA
Lea el libro electrónico: La clave para superar los obstáculos del desarrollo de la IA, o descargue una versión PDF del libro electrónico.

La clave para superar los obstáculos del desarrollo de la IA: datos más fiables

Hoy en día, la persona promedio ahora tiene millones de veces más poder de computación en su bolsillo de lo que la NASA tuvo para lograr el alunizaje en 1969. Ese mismo dispositivo ubicuo que demuestra convenientemente una abundancia de poder de computación también está cumpliendo otro prerrequisito para la edad de oro de la IA: abundancia de datos. Según los conocimientos del Information Overload Research Group, el 90% de los datos del mundo se crearon en los últimos dos años. Ahora que el crecimiento exponencial en el poder de la computación finalmente ha convergido con un crecimiento igualmente meteórico en la generación de datos, las innovaciones de datos de inteligencia artificial están explotando tanto que algunos expertos creen que impulsarán una Cuarta Revolución Industrial.

Los datos de la Asociación Nacional de Capital de Riesgo indican que el sector de la inteligencia artificial registró una inversión récord de $ 6.9 mil millones en el primer trimestre de 2020. No es difícil ver el potencial de las herramientas de inteligencia artificial porque ya se está aprovechando a nuestro alrededor. Algunos de los casos de uso más visibles para los productos de inteligencia artificial son los motores de recomendación detrás de nuestras aplicaciones favoritas, como Spotify y Netflix. Aunque es divertido descubrir un nuevo artista para escuchar o un nuevo programa de televisión para ver, estas implementaciones son de poca importancia. Otros algoritmos califican los puntajes de las pruebas, que determinan en parte dónde se acepta a los estudiantes en la universidad, y otros analizan los currículums de los candidatos, decidiendo qué solicitantes obtienen un trabajo en particular. Algunas herramientas de IA pueden incluso tener implicaciones de vida o muerte, como el modelo de IA que detecta el cáncer de mama (que supera a los médicos).

A pesar del crecimiento constante tanto en los ejemplos del mundo real de desarrollo de IA como en la cantidad de nuevas empresas que compiten por crear la próxima generación de herramientas de transformación, persisten los desafíos para el desarrollo y la implementación efectivos. En particular, la salida de AI es tan precisa como lo permite la entrada, lo que significa que la calidad es primordial.

Obstáculos para el desarrollo de la IA

El desafío de la calidad de datos inconsistente en las soluciones de inteligencia artificial

De hecho, se genera una cantidad increíble de datos todos los días: 2.5 trillones de bytes, según Social Media Today. Pero eso no significa que todo sea digno de entrenar su algoritmo. Algunos datos están incompletos, otros son de baja calidad y algunos son simplemente inexactos, por lo que el uso de esta información defectuosa dará como resultado los mismos rasgos de su (costosa) innovación de datos de inteligencia artificial. Según una investigación de Gartner, alrededor del 85% de los proyectos de IA creados para 2022 producirán resultados inexactos debido a datos sesgados o inexactos. Si bien puede omitir fácilmente una recomendación de canción que no se adapte a sus gustos, otros algoritmos inexactos tienen un costo financiero y de reputación significativo.

En 2018, Amazon comenzó a utilizar una herramienta de contratación impulsada por IA, en producción desde 2014, que tenía un sesgo fuerte e inconfundible contra las mujeres. Resulta que los modelos informáticos que sustentan la herramienta se capacitaron utilizando currículums presentados a la empresa durante una década. Debido a que la mayoría de los solicitantes de tecnología eran hombres (y todavía lo son, tal vez debido a esta tecnología), el algoritmo decidió penalizar los currículums con “mujeres” incluidas en cualquier lugar: capitán de fútbol femenino o grupo empresarial femenino, por ejemplo. Incluso decidió sancionar a las aspirantes a dos universidades femeninas. Amazon afirma que la herramienta nunca se usó como el único criterio para evaluar candidatos potenciales, sin embargo, los reclutadores miraron el motor de recomendaciones al buscar nuevas contrataciones.

La herramienta de contratación de Amazon finalmente se descartó después de años de trabajo, pero la lección persiste y destaca la importancia de la calidad de los datos al entrenar algoritmos y herramientas de inteligencia artificial. ¿Qué aspecto tienen los datos de "alta calidad"? En resumen, marca estas cinco casillas:

1. Relevante

Para ser considerados de alta calidad, los datos deben aportar algo valioso al proceso de toma de decisiones. ¿Existe una correlación entre el estado de un solicitante de empleo como campeón estatal de salto con pértiga y su desempeño en el trabajo? Es posible, pero parece muy poco probable. Al eliminar los datos que no son relevantes, un algoritmo puede centrarse en clasificar la información que realmente afecta los resultados.

2. Exacto

Los datos que utiliza deben representar con precisión las ideas que está probando. Si no, no vale la pena. Por ejemplo, Amazon entrenó su algoritmo de contratación utilizando 10 años de currículums de solicitantes, pero no está claro si la empresa confirmó primero la información proporcionada en esos currículums. La investigación de la compañía de verificación de referencias Checkster demuestra que el 78% de los solicitantes miente o consideraría mentir en una solicitud de empleo. Si un algoritmo toma decisiones de recomendación utilizando el GPA de un candidato, por ejemplo, es una buena idea confirmar primero la autenticidad de esos números. Este proceso llevaría tiempo y dinero, pero sin duda alguna mejoraría la precisión de sus resultados.

3. Debidamente organizado y anotado

En el caso de un modelo de contratación basado en currículums, la anotación es relativamente fácil. En cierto sentido, un currículum viene anotado previamente, aunque sin duda habrá excepciones. La mayoría de los solicitantes enumeran su experiencia laboral en el encabezado "Experiencia" y las habilidades relevantes en "Habilidades". Sin embargo, en otras situaciones, como la detección del cáncer, los datos serán mucho más variados. La información puede venir en forma de imágenes médicas, los resultados de un examen físico o incluso una conversación entre el médico y el paciente sobre el historial de salud familiar y casos de cáncer, entre otras formas de datos. Para que esta información contribuya a un algoritmo de detección preciso, debe organizarse y anotarse cuidadosamente para garantizar que el modelo de IA aprenda a hacer predicciones precisas basadas en las inferencias correctas.

4. Actualizado

Amazon estaba intentando crear una herramienta que ahorraría tiempo y dinero al reproducir las mismas decisiones de contratación que toman los humanos en mucho menos tiempo. Para que las recomendaciones sean lo más precisas posible, los datos deben mantenerse actualizados. Si una empresa alguna vez demostró preferencia por candidatos con la capacidad de reparar máquinas de escribir, por ejemplo, estas contrataciones históricas probablemente no influirían mucho en la idoneidad de los solicitantes de empleo actuales para ningún tipo de puesto. Como resultado, sería conveniente eliminarlos.

5. Apropiadamente diverso

Los ingenieros de Amazon optaron por entrenar un algoritmo con un grupo de solicitantes que era abrumadoramente masculino. Esta decisión fue un error crítico, y no es menos atroz por el hecho de que esos eran los currículums que la compañía tenía disponibles en ese momento. Los ingenieros de Amazon podrían haberse asociado con organizaciones estimadas con similares puestos disponibles que habían recibido más mujeres solicitantes de empleo para compensar la falta, o podría haber reducir artificialmente el número de currículums de hombres para igualar el número de mujeres y capacitar y guió el algoritmo con una representación más precisa de la población. El punto es que los datos La diversidad es clave y, a menos que se haga un esfuerzo concertado para eliminar el sesgo en las entradas, las salidas sesgadas prevalecer.

Claramente, los datos de alta calidad no aparecen de la nada. En cambio, debe ser cuidadosamente seleccionado teniendo en cuenta los resultados previstos. En el campo de la IA, a menudo se dice que "si entra basura significa que sale basura". Esta afirmación es cierta, pero subestima un poco la importancia de la calidad. La IA puede procesar cantidades increíbles de información y convertirla en cualquier cosa, desde selecciones de acciones hasta recomendaciones de contratación y diagnósticos médicos. Esta capacidad supera con creces la capacidad de los humanos, lo que también significa que magnifica los resultados. Un reclutador humano sesgado solo podría pasar por alto a un número limitado de mujeres, pero un reclutador de IA sesgado podría pasarlas por alto a todas. En ese sentido, la basura que entra no solo significa que sale basura, sino que una pequeña cantidad de datos "basura" puede convertirse en un vertedero completo.

Superar los obstáculos del desarrollo de la IA

Los esfuerzos de desarrollo de IA incluyen obstáculos significativos sin importar en qué industria se desarrollen, y el proceso de pasar de una idea factible a un producto exitoso está plagado de dificultades. Entre los desafíos de adquirir los datos correctos y la necesidad de anonimizarlos para cumplir con todas las regulaciones relevantes, puede parecer que construir y entrenar un algoritmo es la parte fácil.

Para brindarle a su organización todas las ventajas necesarias en el esfuerzo por diseñar un nuevo y revolucionario desarrollo de inteligencia artificial, querrá considerar asociarse con una empresa como Shaip. Chetan Parikh y Vatsal Ghiya fundaron Shaip para ayudar a las empresas a diseñar los tipos de soluciones que podrían transformar la atención médica en los EE. UU. Después de más de 16 años en el negocio, nuestra empresa ha crecido hasta incluir más de 600 miembros del equipo y hemos trabajado con cientos de clientes para convertir ideas convincentes en soluciones de inteligencia artificial.

Con nuestra gente, procesos y plataforma trabajando para su organización, puede desbloquear inmediatamente los siguientes cuatro beneficios y catapultar su proyecto hacia un final exitoso:

1. La capacidad de liberar a sus científicos de datos


No hay forma de evitar que el proceso de desarrollo de la IA requiera una inversión considerable de tiempo, pero siempre puede optimizar las funciones que su equipo dedica más tiempo a realizar. Contrató a sus científicos de datos porque son expertos en el desarrollo de algoritmos avanzados y modelos de aprendizaje automático, pero la investigación demuestra constantemente que estos trabajadores en realidad dedican el 80% de su tiempo a buscar, limpiar y organizar los datos que impulsarán el proyecto. Más de las tres cuartas partes (76%) de los científicos de datos informan que estos procesos mundanos de recopilación de datos también son sus partes menos favoritas del trabajo, pero la necesidad de datos de calidad deja solo el 20% de su tiempo para el desarrollo real, que es el trabajo más interesante e intelectualmente estimulante para muchos científicos de datos. Al obtener datos a través de un proveedor externo como Shaip, una empresa puede permitir que sus costosos y talentosos ingenieros de datos subcontraten su trabajo como conserjes de datos y, en cambio, dediquen su tiempo a las partes de las soluciones de inteligencia artificial donde pueden producir el mayor valor.

2. La capacidad de lograr mejores resultados

Muchos líderes de desarrollo de IA deciden utilizar datos de código abierto o de colaboración colectiva para reducir los gastos, pero esta decisión casi siempre termina costando más a largo plazo. Estos tipos de datos están fácilmente disponibles, pero no pueden igualar la calidad de conjuntos de datos cuidadosamente seleccionados. Los datos de colaboración colectiva, en particular, están plagados de errores, omisiones e inexactitudes, y aunque estos problemas a veces pueden resolverse durante el proceso de desarrollo bajo la atenta mirada de sus ingenieros, se requieren iteraciones adicionales que no serían necesarias si comenzara con una -Datos de calidad desde el principio.

Confiar en datos de código abierto es otro atajo común que viene con su propio conjunto de trampas. La falta de diferenciación es uno de los mayores problemas, porque un algoritmo entrenado con datos de código abierto se replica más fácilmente que uno construido sobre conjuntos de datos con licencia. Al seguir esta ruta, invita a la competencia de otros participantes en el espacio que podrían reducir sus precios y tomar participación de mercado en cualquier momento. Cuando confía en Shaip, está accediendo a los datos de la más alta calidad reunidos por una mano de obra hábil administrada, y podemos otorgarle una licencia exclusiva para un conjunto de datos personalizado que evita que los competidores recreen fácilmente su propiedad intelectual ganada con tanto esfuerzo.

3. Acceso a profesionales experimentados

Acceso a profesionales experimentados Incluso si su lista interna incluye ingenieros calificados y científicos de datos talentosos, sus herramientas de inteligencia artificial pueden beneficiarse de la sabiduría que solo se obtiene a través de la experiencia. Nuestros expertos en la materia han encabezado numerosas implementaciones de IA en sus campos y han aprendido valiosas lecciones a lo largo del camino, y su único objetivo es ayudarlo a lograr el suyo.

Con expertos en el dominio que identifican, organizan, categorizan y etiquetan los datos por usted, sabe que la información utilizada para entrenar su algoritmo puede producir los mejores resultados posibles. También realizamos un control de calidad regular para asegurarnos de que los datos cumplan con los más altos estándares y funcionen según lo previsto, no solo en un laboratorio, sino también en una situación del mundo real.

4. Un cronograma de desarrollo acelerado

El desarrollo de la IA no ocurre de la noche a la mañana, pero puede suceder más rápido cuando se asocia con Shaip. La recopilación y anotación de datos internos crea un cuello de botella operativo significativo que detiene el resto del proceso de desarrollo. Trabajar con Shaip le brinda acceso instantáneo a nuestra amplia biblioteca de datos listos para usar, y nuestros expertos podrán obtener cualquier tipo de información adicional que necesite con nuestro profundo conocimiento de la industria y nuestra red global. Sin la carga del abastecimiento y la anotación, su equipo puede comenzar a trabajar en el desarrollo real de inmediato, y nuestro modelo de capacitación puede ayudar a identificar inexactitudes tempranas para reducir las iteraciones necesarias para cumplir con los objetivos de precisión.

Si no está listo para subcontratar todos los aspectos de su gestión de datos, Shaip también ofrece una plataforma basada en la nube que ayuda a los equipos a producir, modificar y anotar diferentes tipos de datos de manera más eficiente, incluida la compatibilidad con imágenes, video, texto y audio. . ShaipCloud incluye una variedad de herramientas intuitivas de validación y flujo de trabajo, como una solución patentada para rastrear y monitorear cargas de trabajo, una herramienta de transcripción para transcribir grabaciones de audio complejas y difíciles, y un componente de control de calidad para garantizar una calidad sin concesiones. Lo mejor de todo es que es escalable, por lo que puede crecer a medida que aumentan las diversas demandas de su proyecto.

La era de la innovación de la inteligencia artificial apenas está comenzando, y veremos avances e innovaciones increíbles en los próximos años que tienen el potencial de remodelar industrias enteras o incluso alterar la sociedad en su conjunto. En Shaip, queremos utilizar nuestra experiencia para servir como una fuerza transformadora, ayudando a las empresas más revolucionarias del mundo a aprovechar el poder de las soluciones de IA para lograr objetivos ambiciosos.

Tenemos una gran experiencia en aplicaciones de atención médica e inteligencia artificial conversacional, pero también tenemos las habilidades necesarias para entrenar modelos para casi cualquier tipo de aplicación. Para obtener más información sobre cómo Shaip puede ayudarlo a llevar su proyecto desde la idea hasta la implementación, eche un vistazo a los muchos recursos disponibles en nuestro sitio web o comuníquese con nosotros hoy.

Una cronología de desarrollo acelerada

Hablemos

  • Al registrarme, estoy de acuerdo con Shaip Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.