Aprovechar los modelos de IA para mejorar los resultados de los desplazados internos

En nuestra publicación anterior, discutimos cómo todavía estamos en las etapas iniciales de comprensión del impacto potencial de los modelos de IA más nuevos en la automatización de procesos, y cómo, dada esta incertidumbre, tener una plataforma que le permita aprovechar diferentes modelos para diferentes casos de uso ofrece un beneficio a prueba de futuro. En esta entrada del blog, profundizaremos un poco más en esos diversos modelos de IA y en cómo las diferentes aplicaciones pueden optimizar los resultados del procesamiento inteligente de documentos.

Tipos de modelos de IA y opciones de implementación


Grandes Modelos de Lenguaje (LLM) e IA Generativa
Los modelos de lenguaje grandes son una clase de modelos de procesamiento del lenguaje natural (NLP) que se entrenan en conjuntos de datos masivos. Debido a su interfaz cotidiana y fácil de usar, la que probablemente la gente esté más familiarizada hoy en día es GPT-3 o GPT-4 de OpenAI, a través de su chatbot: ChatGPT.

La última versión del motor de búsqueda Bing utiliza un LLM de próxima generación de OpenAI que se ha personalizado para la búsqueda. El BARD de Google se basa en su Modelo de Lenguaje Pathways (PaLM).

La IA generativa se refiere a la funcionalidad de creación de contenido de estos sistemas, y cubre no solo el chat, sino también la creación de imágenes y videos (por ejemplo, Dall-E, Midjourney).

¿Por qué es importante esta distinción para la automatización de procesos basada en documentos? Desacoplar los LLM de la funcionalidad de creación de contenido del sistema significa que una solución puede beneficiarse de su comprensión, sin tener que preocuparse por algunas de las desventajas, como el hecho de que los servicios de IA generativa son propensos a las alucinaciones. It also means that results can be combined from multiple different models or combined with traditional capture to avoid these falsehoods.

Modelos de IA de nicho
Los modelos de IA de nicho están diseñados para tareas o dominios específicos y especializados, y están más ajustados para sobresalir en un área en particular. Se entrenan previamente en un conjunto de datos grande y diverso y, posteriormente, se ajustan en un conjunto de datos más específico relevante para un dominio o tarea en particular. Al igual que los LLM, estos no se limitan a una organización y están disponibles para conectarse a los procesos de negocio para tareas más especializadas.

Modelos de IA personalizados
A diferencia de los LLM, este enfoque comienza sin un conjunto de datos previamente entrenados. Los modelos personalizados son modelos de aprendizaje automático que se adaptan y entrenan específicamente para una tarea o dominio determinados.

Con un modelo personalizado, el primer paso es etiquetar un conjunto de datos de documentos con los valores que se van a extraer y crear un modelo entrenado basado en ese conjunto de datos.

Este enfoque permite obtener resultados más específicos y afinados. Los modelos se pueden crear con conjuntos de muestras relativamente pequeños y refinarse para abordar problemas específicos. Esto requiere algunos conocimientos especializados, funciona tanto para imágenes como para texto, y se puede utilizar para escenarios específicos en los que hay imágenes de calidad deficiente y variable (por ejemplo, las capturadas en un dispositivo móvil).

Servicios de hiperescala
Los grandes hiperescaladores (Microsoft, Amazon, Google) continúan agregando servicios relacionados con documentos y datos a sus plataformas en la nube. Aquí, los modelos se actualizan y refinan continuamente, por lo que es fácil aprovechar los ciclos de mejora continua (o ceñirse a una versión de modelo probada y confiable).

Hay opciones tanto para modelos preconstruidos como personalizados, lo que le permite elegir el mejor enfoque para lo que está tratando de lograr. Algunos servicios solo están disponibles para ejecutarse en la nube, mientras que otros se pueden descargar y ejecutar localmente como contenedores, lo que puede dar lugar a limitaciones para algunas organizaciones. Los precios pueden ser algo dinámicos, ya que los proveedores se reservan el derecho de cambiar los precios en cualquier momento.

Donde cada uno de estos es más apropiado:


La elección del modelo a utilizar depende de varios factores, como la naturaleza de los datos, la disponibilidad de recursos, los niveles de precisión deseados, la complejidad y los requisitos de procesamiento de datos.

  • Los LLM son adecuados para procesos de tipo analítico (por ejemplo, análisis de contratos), análisis y clasificación de sentimientos, resumen de contenido, búsqueda inteligente y etiquetado de documentos. Son fáciles de implementar y requieren un ajuste mínimo, sin embargo, es posible que no sean tan precisos o específicos del dominio como los modelos personalizados.
  • Los modelos personalizados son beneficiosos cuando la calidad de los datos y el cumplimiento son una preocupación principal, o cuando se trata de tipos de documentos específicos o clasificación de imágenes, ya que proporcionan más control sobre el proceso de capacitación, lo que permite a las organizaciones adaptarse a sus necesidades específicas.
  • Los servicios de hiperescala son una excelente opción como alternativa al OCR para documentos difíciles o ruidosos y aquellos que contienen elementos escritos a mano y permiten una implementación rápida, ya que están listos para usar con una configuración mínima.

 

Orquestación de la IA para el cumplimiento normativo


Con la creciente implementación de regulaciones de gobernanza relacionadas con la IA, especialmente en relación con la forma en que las empresas se relacionan con las personas, creemos que la demanda de "IA explicable" se intensificará aún más, lo que significa que deberá haber claridad en torno a las decisiones o predicciones realizadas. Es probable que esta tendencia conduzca a una disminución del uso de modelos personalizados de gran tamaño que solo proporcionan respuestas sin explicaciones suficientes de su derivación. En cambio, la experiencia en nuestro campo nos dice que habrá una preferencia por combinar múltiples modelos más pequeños, donde la navegación inteligente entre esos modelos se controlará y administrará mediante una plataforma de orquestación automatizada.

Este mismo enfoque también puede desempeñar un papel vital en la mitigación de errores y equivocaciones. En última instancia, es mucho más costoso corregir un falso positivo en sentido descendente que corregir un error válido. Este enfoque permite a las organizaciones la capacidad de combinar y validar varios enfoques entre sí, así como con fuentes de datos conocidas. Al aprovechar esta metodología, las organizaciones pueden garantizar una mayor precisión y confiabilidad en sus operaciones.

----------------------------

Seguir leyendo.....más información sobre la IA para la toma de decisiones relacionadas con los humanos.

El producto estrella de TCG Process, DocProStar, combina el modelado y la orquestación de procesos con la automatización inteligente y las capacidades de procesamiento de documentos de extremo a extremo.

 

Nos encantaría mostrárselo. Obtenga más información o póngase en contacto con nosotros hoy mismo.