Cuando Microsoft lanzó Project Cortex en Microsoft Ignite 2019, lo introdujo como un nuevo servicio en Microsoft 365 basado en un conjunto de nuevos servicios de Inteligencia Artificial (IA) innovadores y el API de Microsoft Graph que facilitan:
- Conectar las personas al conocimiento (lo que ahora conocemos como Viva Topics en Microsoft Viva).
- Reconocer, extraer y transformar información de contenido estructurado y no estructurado (lo que ahora conocemos como SharePoint Syntex).
- Proteger y administrar de forma inteligente información y contenido con las características de Seguridad y Compliance de Microsoft 365.

Figura 1.- Overview de Project Cortex (Fuente: Microsoft).
Con estos elementos claves, Project Cortex viene a paliar los principales problemas de gestión de información presentes actualmente en muchas organizaciones:
- Silos de información desconectados a lo largo de aplicaciones y sistemas legacy y de negocio.
- Introducción manual de información sujeta a errores e interpretación y con un alto coste económico.
- Improductividades en la búsqueda de información.
- Información duplicada en distintas aplicaciones y sistemas.
- Imposibilidad (o simplemente es muy complicado) de poder categorizar la información con metadatos y taxonomías predefinidas.
- Etc
Cortex no solo permite paliar estos problemas, sino que además puede proporcionar un claro retorno económico a las organizaciones que lo adopten tal y como refleja el Estudio conducido por Forrester y publicado en 2021 respecto al impacto económico de Project Cortex:
- Ahorro en la clasificación de contenidos: De $1.2 M a $3.3 M.
- Ahorro por mejorar el descubrimiento de información: De $42 M a $127 M.
- Ahorro en herramientas legacy servicios profesionales: $864 K a $1.2 M.
Project Cortex proporciona a los clientes de Microsoft 365 los siguientes elementos fundamentales que resuelven los problemas y generan el retorno económico indicados:
- Comprensión de Información gracias a la IA.
- Procesado y transformación de información.
- Governanza, Seguridad y Complianza en la información capturada y transformada.
Y son precisamente estos elementos fundamentales son los que nos llevan a hablar de SharePoint Syntex, el primer producto comercial de Project Cortex liberado por Microsoft en octubre de 2020.
SharePoint Syntex
SharePoint Syntex es un nuevo servicio disponible como AddOn en planes de Microsoft 365 que se asienta sobre SharePoint Online y los nuevos servicios de IA para proporcionar las siguientes funcionalidades en la captura, procesado y gobierno de la información:
- Comprensión de la información mediante modelos de IA sin código que permiten identificar y extraer información de contenidos estructurados (Una orden de compra) o no estructurados (un contrato) para almacenar y clasificar estos de forma inteligente en la Gestión Documental que modelemos en la plataforma.
- Procesado de información a través de automatizar la captura, ingesta y categorización de contenidos mediante procesos de negocio modelados con Power Apps. Por ejemplo, todo contrato identificado y procesado por Syntex se envíe a firmar a un tercero de confianza.
- Seguridad y Compliance de la información: Además de identificar y extraer información de los contenidos, aplicar de forma automática etiquetas de retención y/o de protección en función del tipo de contenido al que corresponda la información.
Pero: ¿Qué aporta Syntex desde el punto de vista de captura y procesado de información disponible en documentos de distintos tipos? La respuesta es que Syntex supone pasar del Machine Learning Convencional caracterizado por:
- Hacer uso de una Inteligencia Artificial de tipo “Black Box”, es decir, que no es muy influenciable.
- Necesitar un número de muestra grande para poder producir unos resultados de captura de información con una cierta precisión.
- Necesitar interacción “humana” para revisar los resultados del procdesado.
Figura 2.- Machine Learning Convencional (Fuente: Microsoft).
A un modelo de tipo Machine Taching caracterizado por:
- Una Inteligencia Artificial “Human-centric”, es decir, que mejora con el tiempo y en base al aprendizaje.
- Requerir de un número de muestras reducido (Con solo 5 es suficiente para identificar un documento) para generar resultados precisos.
- Revisión de los resultados “de forma temprana” para mejorar los modelos de Machine Teaching.
Figura 3.- Modelo Machine Teaching (Fuente: Microsoft).
Si bajamos un poco a tierra, SharePoint Syntes proporciona dos tipos de procesados de información basados en IA:
- Identificación y procesado de documentos de naturaleza no naturaleza no estructurada (Por ejemplo Contratos) a partir de:
- Crear un “Document understanding model”.
- Definir Clasificadores Entrenables (Trainable Classifiers) para identificar documentos (Formato PDF, Office) con un conjunto pequeños de documentos incluyendo muestras negativas.
- Extraer metadatos de los documentos que posteriormente se utilicen para clasificar los documentos.
- Identificar y procesas documentos de naturaleza semiestructurada (Por ejemplo un Pedido) a partir de:
- Un Modelo de IA creado con el AI Builder de la Power Platform.
- Definir (etiquetar) la información a extraer de los documentos (Formato PDF, JPG, PNG).

Figura 4.- Espectro de identificación y procesado de documentos (Fuente: Microsoft).
Finalmente, SharePoint Syntex se aprovecha de las capacidades de Seguridad y Compliance de Microsoft 365 para aplicar de forma automática Etiquetas de retención que permitan retener ciertos documentos en función del tipo documental y a futuro aplicar etiquetas de protección que permitan de la misma forma encriptar y proteger los documentos en base a las condiciones que cumplan.
Conclusión
Bajo el nombre de Project Cortex hemos visto y veremos una serie de nuevos Servicios y Soluciones de Microsoft basados en servicios de IA innovadores y destinados a conectar personas y conocimiento, identificar y procesar contenidos de manera inteligente y todo ello enlazado con elementos de Seguridad y Compliance.