Clasificación del lenguaje jurídico: barrera de entrada de la Inteligencia Artificial en el Derecho

Clasificación del lenguaje jurídico: barrera de entrada de la Inteligencia Artificial en el Derecho

Damas y caballeros, bienvenidas, bienvenidosen esta ponencia. Me llamo Philippe Prince, soy investigadordocente en el Laboratorio de Derecho e Inteligencia Artificial de la Universidad Panamericanade México, un espacio académico que trabaja acerca de la digitalización del derecho. Nuestras investigaciones en este sector nosllevan a examinar las expectativas que la inteligencia artificial nos puede ofrecercuando aplicamos sus técnicas al derecho. Así que el tema que vamos a desarrollar hoyes el siguiente: La clasificación del lenguaje jurídico, y vamos a ver porqué esta clasificaciónes central para la Inteligencia artificial y porque la clasificación del lenguaje jurídicoes una barrera de entrada para la Inteligencia Artificial en el campo del Derecho. Porque cuando hablamos de Inteligencia Artificial,pues tenemos a veces una concepción equivocada de lo que se puede hacer en el campo del derecho. Y me gustaría llamar su atención sobre estadeclaración: Las máquinas van a poder hacer en 20 años cualquier trabajo humano. ¿Cuándo creen que esta frase fue escrita?¿Ustedes piensan que esa frase se encuentra en un libro de ciencia ficción? Respuesta… ¡No! Y no fue cualquier persona. Herbert Simon,Premio Nobel de Economía... en 1965... Así que, no les va a sorprender si les digoque se equivocó bastante. Esa frase es típica de un tecno-entusiasta. Y de hecho, ilustraque, quien sea que sea, incluso yo, que hace una predicción sobre el futuro de la inteligenciaartificial, hay que tener un poco de cuidado. La mejor manera de aprovechar la tecnologíaes tener una postura realista acerca de esta tecnología. A menudo nos imaginamos la inteligenciaartificial como un ente absoluto, cuando en realidad las inteligencias artificiales, soncapaces hacer tareas muy especificas, en campos muy específicos. Entonces en esta presentaciónles voy a explicar porque esta declaración no es verdadera, tampoco en nuestra época,y menos en el campo del Derecho. No es verdad por las limitaciones inherentesal tratamiento del lenguaje natural, y eso lo vamos a ver en una primera parte. Después, veremos cómo el derecho es un objetoespecial que es particularmente delicado para tratar con nuestras técnicas actuales deinteligencia artificial, pero también veremos que vale la pena elesfuerzo de intentar usar el tratamiento del lenguaje natural para mejorar la practicadel derecho Finalmente, concluiremos evaluando las tendenciasde la investigación en la inteligencia artificial y el derecho a la luz de estos desarrollos. "Natural Language Processing" o "Procesamientodel Lenguaje Natural" es una de las principales áreas de investigación en el campo de lastecnologías de la información. Acostúmbrense a este termino porque va a ser muy usado enlos próximos años, incluso en el campo del derecho. Y ¿que quiere decir? Pues es más fácil explicarlo con su objetivo.Antes, el Procesamiento del Lenguaje Natural se llamaba NLU: Natural Language Understanding. El objetivo del Procesamiento del LenguajeNatural es "lograr con una máquina un procesamiento del lenguaje similar al de los humanos". Unacomprensión de texto por la máquina. Pero ese objetivo aún no se ha logrado. Estose debe a que las actividades del pensamiento humano involucran una enorme colección dediferentes estructuras y procesos. La investigación en el procesamiento dellenguaje natural se ha estado llevando a cabo durante varias décadas. Y cuando uno se interesaal Procesamiento del Lenguaje Natural, tiene que entender una cosa: el lenguaje naturales complejo. Con una computadora no vamos analizar caracteres por caracteres, sino quevamos a poner las palabras en un contexto para intentar extraer la semántica, y esohoy en día se hace mediante redes neuronales artificiales, que buscan reproducir muy pequeñosmecanismos muy sencillos del cerebro humano. A esas redes neuronales artificiales les vamosa dar cantidades grandes de textos para intentar generar lo que se llaman “espacios semánticos”. Y algunos investigadores han descubierto algomuy peculiar con esas técnicas. Han demostrado que la semántica de dos idiomas, por ejemplo,del inglés y del español, son de hecho dos espacios casi isomorfos, en el sentido deque puedes girar el espacio de la semántica del inglés … para que casi coincida conel espacio semántico del español. Este enfoque supera todos los demás enfoques de traducciónpalabra por palabra. Pero eso no significa que los algoritmos hayanalcanzado un nivel humano en la lectura, especialmente porque la inteligencia artificial todavíatiene problemas para inferir el significado de una frase, de un párrafo, y peor aúnde un documento. Pero surge una pregunta: ¿Podemos hacer lomismo con los textos jurídicos? ¿Podemos dar a la máquina cantidades grandes de textosjurídicos para que los entienda e infiera el sentido de los conceptos que contiene? A ver, ya podemos intentar una respuesta parcialdiciendo que: Numero uno, no estamos hablando aquí de traducciónmediante la semántica, sino de sentido. Numero dos, el derecho tiene sus propias reglasy su propio lenguaje técnico. Numero tres, el derecho, al usar el lenguaje,es necesariamente ambiguo. Por ejemplo, si les digo que los vehículosestán prohibidos en el parque, pues no saben si hablo de patinetes o de tractores, y tampocosi eso incluye el espacio aéreo arriba del parque. Bueno, en realidad, ustedes lo puedenadivinar porque tienen sentido común. Una máquina no. Pero va más allá de eso. Los conceptos jurídicosno son como otros conceptos y requieren una experiencia particularmente aguda para sercomprendidos. Algunos términos evolucionan a lo largo del tiempo, pero también a lolargo de las interpretaciones. Por ejemplo, puedes tomar el primer artículo de cualquierconstitución de cualquier país, diseccionarlo frase por frase, palabra por palabra, y escribirun libro de 400 páginas sobre él sin dificultad. ¿Porqué? Porque el contexto inmediato de un texto jurídicono es suficiente. Las formulaciones jurídicas vienen con su historia e intención que vamás allá de una frase en lenguaje natural. El derecho utiliza un lenguaje técnico, contienesutilezas que no siempre se indican expresamente en el texto jurídico, ni en otros textosrelacionados con este texto jurídico. Y eso, no lo sabe una máquina con las técnicasactuales de Procesamiento del Lenguaje Natural. Aunque los mismos tipos de retos existen enel lenguaje clásico, el lenguaje jurídico es un objeto particular. Como pequeña ilustración, ¿Cómo se suponeque una máquina pueda inferir el significado de tal cláusula? Antes que nada, la máquinadebe ser capaz de delimitarla en un texto completo y darle una etiqueta que la contextualice.Es algo que un estudiante de primer año hace muy bien, pero esas pistas visuales y contextualesque emplean los documentos jurídicos son un verdadero reto para una máquina. Pero además, todos los conceptos deben serinterpretados y pueden, en el curso de un litigio, inclinar el balance de una manerau otra. Cada uno de estos conceptos se refiere a unalista más o menos extensa de derechos y obligaciones, que forman parte de una cadena, mas o menosextensa otra vez, de normas, intenciones, causalidades y jerarquía jurídica. Así que realmente, la clasificación de esosconceptos jurídicos, su identificación y sus relaciones entre sí, es algo particularmentearduo. PERO La buena noticia, es que no es un problemaimposible de resolver, pero no podemos usar los métodos para crear espacios semánticos,los mismos métodos. Necesitamos cubrir esta brecha entre la tecnología y el derecho usandoel principio de realidad, generando nodos del conocimiento entre el Derecho y la InteligenciaArtificial. Necesitamos que el humano enseñe a la máquina, etiquetando manualmente milesy miles de disposiciones legales, clausulas de contratos, argumentos en una demanda. Conesos ejemplos, identificados de una manera no ambigua, entonces los algoritmos de aprendizajeautomático pueden aprender. Y de hecho, si observamos la evolución deldesempeño de otros algoritmos que usan redes neuronales artificiales, vemos que el hechode que tengan acceso a bases de datos etiquetadas ha sido decisivo en su mejora. Entonces, la clasificación del lenguaje jurídicosí es una barrera de entrada, pero no es una barrera definitiva. Vale la pena concentrarseen ello para mejorar los clasificadores jurídicos. Ahora, la pregunta es… ¿vale la pena saltaresta barrera? ¿Invertir tanto tiempo en la clasificación? Pues, mejorar la clasificación de conceptosjurídicos permite justamente crear herramientas muy útiles para los abogados, los notarios,para incluso los beneficiarios de la práctica jurídica. 1. Categorización de recursos jurídicos,2. Resumen automático de información jurídica 3. Extracción de información relevante4. Análisis estadístico Si se mejora el tratamiento del lenguaje jurídico,se podrán automatizar cada vez más tareas sobre la base de una representación confiablede conceptos jurídicos complejos. El hecho de que seamos capaces de fabricarmáquinas que analicen los textos legales está dando resultados muy prometedores parael trabajo mas repetitivo del abogado, pero la complejidad de las tareas que siguen despuésde este análisis, son todavía del pleno dominio del abogado. Un ejemplo, este estudio de 2019 que muestracómo una máquina puede detectar las cláusulas potencialmente abusivas con un análisis dellenguaje jurídico. Es una aplicación en inglés que es específica para una tareaparticular, y siempre hay un margen de error, pero ya es un avance impresionante que nosmuestra una tendencia. Ahora bien, una vez que estén detectadas estas clausulas abusivas,todavía falta un trabajo del abogado para que pueda dar una asesoría a su cliente enun caso concreto. Y entonces, que sigue para la inteligenciaartificial una vez que rompemos esta barrera de la clasificación del lenguaje jurídico?Pues, eso nos abre la puerta para investigar muchos usos de la IA en el campo del derecho. Claro, después de un obstáculo, hay otro.Y para que nuestras computadoras sean realmente indispensables para nosotros profesionalesdel Derecho, se requiere hacerles entender el significado de lo que les decimos, lo quees diferente de la clasificación del lenguaje jurídico. Normalmente, estos esfuerzos fracasan porqueel significado no es una cosa sino una combinación de muchas. Como lo hemos dicho en introducción,las actividades del pensamiento humano involucran una enorme colección de diferentes estructurasy procesos, no es solamente una clasificación. De hecho, son varias. Las clasificaciones del lenguaje jurídicoson claves para hacer que nuestras computadoras sean más valiosas en el campo del Derecho,y a partir de ahí podemos trabajar sobre técnicas para que nos ayuden y automaticenla labor del abogado a tal grado que se vuelva una mala practica el no uso de la informáticajurídica para un abogado. Entonces lo que sigue, después de esta barrera, es que suministramosnuestras computadoras con una gran biblioteca de conocimientos de sentido común en materiade Derecho. Y de eso Marvin Minsky resalta desde hace 20 años que es lo que se necesitapara nuestros algoritmos, y propone varias etapas de investigación para lograrlo. Las computadoras actuales no están diseñadascon sentido común en ellas, ni tienen la capacidad de aprender de la experiencia. Losprogramas pueden resolver problemas complejos en materias especializadas, pero aún hoyen día, las maquinas no pueden hacer cosas que incluso estudiantes de derecho hacen fácilmente. Y por eso me gustaría concluir con una citade Chowdary que, 20 años después de Minsky, reafirma la relevancia de este problema yla necesidad de tratarlo con un enfoque plural. Las limitaciones actuales de la inteligenciaartificial se deben en gran medida a nuestra búsqueda de teorías unificadas capaces derazonar bien en todas las situaciones. La versatilidad humana puede emerger de una arquitecturade representación a gran escala, donde cada una de las diferentes representaciones puedeayudar a superar las deficiencias de otras representaciones. Y agregaría: particularmente en el campodel derecho. Damas y caballeros, romper la barrera de laclasificación del lenguaje jurídico significa para nosotros abogados crear bases de datosidentificadas y que podamos compartir para aclarar a las máquinas nuestro oscuro arte.Solamente entonces podremos abrir la vía a la Inteligencia artificial y mejorar nuestrapráctica jurídica, no solamente por el bien de nosotros profesionistas del Derecho, sinopara la eficiencia del derecho en general. Gracias por su atención, y gracias al equipode Nodos.

Noticias relacionadas