Blog
El futuro de la información legal en Estados Unidos: Westlaw v. ROSS

Por: Laura Camila Olarte
Hoy en día, el uso de bases de datos para la investigación legal es indispensable en el entorno jurídico, no solo porque agilizan la labor de búsqueda, sino porque disminuyen los costos de operación. Uno de los productos de investigación legal más importantes del mundo es Westlaw, quien en 2020 obtuvo ingresos por más de 4,738 millones de dólares brindando servicios de búsqueda legal y análisis de información con inteligencia artificial[1]. Westlaw no es la única herramienta de investigación en el mercado legal. De hecho, una de las más revolucionarias e importantes de los últimos años es ROSS Intelligence. Lo novedoso de este servicio es que desarrolló un sistema de inteligencia artificial que da respuesta a las preguntas legales que se le realizan, como si fuera un Siri para abogados, y prepara informes de la información recopilada como lo haría un asociado junior[2]. Esto permite que los abogados gasten menos tiempo en la búsqueda de información y preparación de documentos y más con sus clientes.
Desde mayo de 2020, Westlaw y ROSS se convirtieron en los protagonistas de uno de los litigios más importantes en materia de derechos de autor y competencia en Estados Unidos. Por un lado, Westlaw acusó a ROSS de la infracción a sus derechos de autor por el supuesto uso de sus contenidos para crear su propio producto de investigación legal. Por otro lado, ROSS alegó que Westlaw tenía una conducta monopolística y anticompetitiva en el mercado de la investigación legal que impedía el acceso a la información pública en Estados Unidos. Más allá de estas acusaciones mutuas, este caso también se destaca porque lo que está en juego es la forma cómo se entrenan los sistemas de inteligencia artificial. Esto se debe a que para entrenar un sistema de inteligencia artificial se necesita de datos, y si se restringe el uso de esos datos, bien sea a través de derechos de autor o licencias, se puede afectar la manera en que se desarrollan y entrenan programas de inteligencia artificial en el mercado legal.
El origen del conflicto
En mayo del 2020, Thomson Reuters y West Corporation[3] demandaron a ROSS por utilizar el contenido de Westlaw para crear su propio producto de investigación legal. Los demandantes explicaron que ello fue posible porque ROSS contrató a LegalEase, un tercero, que tenía una licencia limitada de uso sobre Westlaw, para que le distribuyera dicho contenido en grandes cantidades. Lo anterior, implicó un quebrantamiento del contrato de servicio celebrado entre Westlaw y LegalEase, ya que este último no podía transferir información de Westlaw en forma masiva a terceros[4].
En vista de la utilización indebida del contenido de Westlaw por parte de ROSS a través de LegalEase, los demandantes alegaron una infracción a sus derechos de autor. Para sustentarlo, señalaron que el contenido de Westlaw era original y creativo[5]. Además, aclararon que Thomson Reuters registraba la base de datos en la Oficina de Copyright de los Estados Unidos cada 3 meses, lo que hacía que fuera el único propietario de todo derecho, título e interés en los derechos de autor de Westlaw. Por lo anterior, concluyeron que ROSS había infringido los derechos de autor sobre el contenido de Westlaw.
Por su parte, ROSS respondió a la demanda alegando que el contenido de Westlaw no tenía protección por derechos de autor porque no era un trabajo creativo o expresivo de autoría, sino un método de operación. Por un lado, señaló que la base de datos de Westlaw estaba compuesta por public law, lo que no puede ser protegido por derechos de autor ya que es de dominio público. Así que, al no estar protegido por derechos de autor, los demandantes no tenían base para prohibirle a ROSS reproducir o crear un trabajo derivado de legislación y jurisprudencia. Por otro lado, explicaron que las herramientas de búsqueda como el sistema de West Key Numbers y los West Heanotes no representaban novedad y no eran originales, por lo que tampoco podían protegerse por derechos de autor. Agregaron que en todo caso, el uso que pudieron tener sobre el contenido de Westlaw podía considerarse como “fair use” bajo el 17 U.S.C. § 107, por lo que de todas formas no constituiría una infracción directa o indirecta a sus derechos de autor.
ROSS a su vez alegó que Thomson Reuters mantenía un monopolio sobre el mercado investigación legal, a través de una variedad de prácticas diseñadas para excluir a los competidores como ROSS. Por ejemplo, explicaron que Westlaw celebraba contratos exclusivos con entidades del Estado para que fuera el proveedor exclusivo de esos contenidos públicos. Además, enfatizaron en que para acceder a su contenido se requería de licencias, y en vista de que las otras bases de datos no eran tan poderosas como Westlaw, las personas se veían obligadas a adquirir sus servicios. De esta forma, los demandantes ejercieron su poder de monopolio para restringir el acceso a la distribución del public law.
Hasta el momento no ha habido pronunciamiento judicial sobre el tema. Sin embargo, son evidentes los dos problemas que deberán abordar los jueces: i) si el contenido de Westlaw goza de protección por derechos de autor, lo que impediría su uso por parte de terceros a menos que tengan permiso y ii) si Westlaw creó un monopolio de investigación legal a través de prácticas anticompetitivas para restringir el acceso a la información pública. Cabe resaltar que lo que subyace debajo de ambos problemas es cómo una restricción al acceso a la información puede afectar la forma en que los programas de inteligencia artificial legales son entrenados, ya que su insumo principal son los datos.
La protección del contenido de Westlaw por derechos de autor
En Estados Unidos como en Colombia los derechos de autor brindan protección a las obras originales de autoría que se encuentren en cualquier medio tangible de expresión. Las compilaciones, que pueden ser bases de datos, gozan de protección por derechos de autor siempre que sus contenidos hayan sido seleccionados, coordinados o dispuestos de tal manera que la obra resultante constituya una obra original de autoría[6]. En el caso Feist v. Rural Telephone Service Co[7], la Corte Suprema dijo que un trabajo de compilación, como una base de datos, debía contener un nivel mínimo de creatividad para poder protegerse en virtud de la ley de derechos de autor. Por lo que no se tendría en cuenta el esfuerzo puesto en ella, si al final la compilación no era original[8].
En este caso, le corresponderá al juez determinar si desde la selección, coordinación o disposición, el contenido de Westlaw es original o no. Así, por un lado, deberá evaluar si el sistema de West Key Numbers, West Heanotes y notas de decisión, que hacen de la experiencia del usuario única y diferente al momento de navegar en la base de datos de Westlaw son suficientemente originales para otorgarles protección. Por otro lado, el juez deberá analizar si el public law que supuestamente fue extraído de la base de datos de Westlaw se entiende protegido por derechos de autor. En principio, no lo sería por dos razones: primero, los derechos de autor sobre una base de datos no se extienden a los contenidos preexistentes y, segundo, el public law no está sujeto a derechos de autor por ser de dominio público.
Con respecto al primer punto, la norma establece que los datos preexistentes no podrán ser protegidos por derechos de autor. Por lo tanto, la extracción de public law como contenido preeexistente de la base de datos de Westlaw no representaría una infracción a los derechos de autor, a menos que recayera sobre la totalidad de la base de datos. En el caso Assessment Technologies v. Wiredata[9], el Tribunal de Apelaciones del Séptimo Circuito decidió que si una compilación contenía datos de dominio público no se podía evitar que otros lo usarán, únicamente se podía restringir el uso del formato específico de la compilación, si este era suficientemente creativo[10]. En consecuencia, en este caso tendría que usarse el formato creativo de la base de datos de Westlaw para ser considerado una infracción por derechos de autor, ya que sus contenidos preexistentes no pueden ser protegidos.
Frente al segundo punto, la base datos de Westlaw al estar compuesta por public law no se le pueden atribuir derechos de autor, ya que ello es de dominio público. Sin embargo, ¿qué pasa con las ediciones y arreglos a los que fueron sometidas las leyes y sentencias por parte de Westlaw? La respuesta no está muy clara. Sin embargo, es importante mencionar que esta no es la primera vez que Westlaw alega derechos de autor sobre sus mejoras y arreglos editoriales. Por ejemplo, en Matthew Bender & Co. v. West Co[11], West alegó que las compilaciones que hacía de los informes de opiniones judiciales estaban protegidos por derechos de autor. En dicha ocasión el Tribunal dijo que ello no reflejaba un ejercicio de originalidad o creatividad, y que otorgar protección de derechos de autor a estas decisiones podría otorgar al demandado un monopolio efectivo sobre la publicación comercial de informes de casos. Por lo que negó la autoría de West sobre esos contenidos.
Sin duda dependerá del criterio del juez definir si la base de datos de Westlaw es original, y en caso de que lo sea, deberá analizar si el public law y las herramientas de búsqueda se entienden protegidas por los derechos de autor de la base de datos. Ello no será fácil porque tanto Westlaw como ROSS se encuentran en lugares opuestos en la defensa de la originalidad de la base de datos. Por lo pronto, parecería que Westlaw tiene un camino largo en la defensa de su contenido por derechos de autor, pues como se pudo ver anteriormente, los jueces exigen una alta carga para demostrar la creatividad de la base de datos y hay antecedentes que le han negado la protección a Westlaw. Por eso, no se puede olvidar que el contenido supuestamente extraído por ROSS es public law, que al ser de dominio público, no puede alegarse derechos de autor, a menos que se considere que sus mejoras editoriales alteran el contenido y su esencia.
Además, aún falta por determinar si el uso que ROSS le dio al contenido de Westlaw constituye “fair use” de acuerdo con el §107 del 17.U.S.C. Para determinarlo los jueces deberan estudiar (i) el propósito y el carácter del uso, (ii) la naturaleza del trabajo protegido por derechos de autor, (iii) la cantidad y la sustancialidad de la parte utilizada en relación con la obra protegida por derechos de autor en su conjunto y (iv) el efecto del uso sobre el mercado potencial. En el caso en concreto, ROSS utilizó fragmentos del contenido de Westlaw para entrenar su sistema de inteligencia artificial y crear su propio producto de investigación legal. Ello, excede la finalidad prevista en la ley para cobijarse bajo la excepción de “fair use”, pues no se busca utilizar el contenido para críticas, comentarios, informes de noticias, enseñanza o investigación, sino que detrás hay una intención de ánimo de lucro y la creación de un producto competidor. El éxito de esta defensa subsidiaria dependerá de la destinación, finalidad y uso que se considere le haya dado ROSS a los contenidos de Westlaw.
Finalmente, hay que mencionar que aun cuando no se demuestre que la base de datos tiene protección de derechos de autor, Westlaw al otorgar sus licencias de uso señaló que no se podía distribuir su contenido a terceros. Es así como se ha tendido a protección contractual a través de licencias para restringir el uso del contenido de las bases de datos. En el caso ProCD v. Zeidenburg[12], la Corte de Apelaciones del Séptimo Circuito sostuvo que una restricción contractual contra la copia en una licencia era exigible y no estaba sujeta a derechos de autor. Dicha decisión fue ampliamente cuestionada, sin embargo, en la práctica jurídica la protección contractual se ha impuesto aún cuando las bases de datos no tiene derechos de autor. Así que, en vista de que Westlaw alegó la infracción indirecta por parte de ROSS en el contrato celebrado entre Westlaw y LegalEase, si se llega a probar dicha responsabilidad indirecta, las cláusulas contractuales se convertirían en una forma de protegerse cuando no se goza de la protección por derechos de autor.
Para terminar, recordemos que el derecho sui generis que existe en Europa para las bases de datos no aplica en Estados Unidos, por lo que a fin de cuentas lo que importa es su originalidad, el objeto de la infracción y en ocasiones hasta el contrato celebrado. En este punto del litigio lo que cobrará importancia será la posibilidad de que empresas que necesiten acceso a la base de datos de Westlaw puedan hacerlo para crear sus propios productos de investigación con inteligencia artificial sin infringir derechos de autor. No obstante, en caso de que se otorgue dicha protección de autoría a Westlaw, el desarrollo de sistemas de inteligencia artificial legales como ROSS se vería truncado, pues al no tener acceso a la información no pueden tan fácilmente entrenar su sistema. Lo que nos lleva al segundo problema jurídico.
La monopolización del mercado de investigación legal
El principal reclamo de ROSS es que Westlaw mantiene un monopolio de la información legal a través de conductas anticompetitivas. Por ejemplo, a través de la firma de contratos exclusivos con entidades del Estado, Westlaw tiene acceso a la información legal. Asimismo, impone condiciones restrictivas de licencia para sus rivales a quienes no les permite acceso a la base de datos, aun cuando están dispuestos a pagar grandes cantidades de dinero, lo que restringe investigación valiosa y oportunidades de desarrollo. Más grave aún, Westlaw no separa el contenido que es públicamente accesible con lo que podría tener protección por derechos de autor. Lo que genera que las personas no puedan acceder a la base de datos a menos que tengan una licencia con Westlaw. Para ROSS, el desarrollo de productos competidores se ha visto seriamente truncado por el acceso restringido y monopolizado a la información que mantiene Westlaw.
Con respecto a lo anterior, el juez deberá determinar bajo Section 2 of the Sherman Act si i) Westlaw goza de un monopolio en el mercado de la investigación y ii) si la adquisición o consolidación de ese monopolio se ha dado a través de conductas anticompetitivas. La decisión que se tome frente a este punto deberá tener en cuenta el trabajo compilatorio y editorial que viene desarrollando Westlaw desde siglo XIX. Mientras que por el otro lado se deberá evaluar la posición privilegiada y dominante de Westlaw en el entorno de investigación legal, que impide que otras compañías puedan emerger, precisamente porque no tienen acceso a la información. De esta discusión se desprende el hecho de que al restringirse el acceso a la información legal, bien sea por medio de licencias o por derechos de autor, se ralentiza la posibilidad de que se desarrollen programas de inteligencia artificial. Por eso es tan relevante la decisión que tomen los jueces, puesto que si se niega definitivamente el acceso a Westlaw, incluso por medio de licencias, se puede estar acaparando un mercado legal y evitando la creación de programas que colaboren en la labor jurídica.
Otro punto que es importante mencionar en términos de libre competencia se refiere a la posibilidad de que en el caso concreto, el mercado de los “datos legales” sea considerado como una “instalación esencial”[13]. Ello implicaría que el sujeto monopolista, que en este caso sería Westlaw, tuviera que dar acceso a su base de datos por medio de licencias a sus competidores como ROSS. Si bien en la contestación de la demanda no se menciona la doctrina de la instalación esencial como un argumento en la defensa de ROSS, el hecho de que decidiera cerrar sus operaciones lleva a pensar que se buscaba probar que sin el acceso a la información legal no podía operar. Esta posición si bien no está en el centro de la controversia es prudente tenerla en cuenta, toda vez que el control sobre los datos es un debate que apenas comienza.
Reflexiones finales
El debate que propone Westlaw y ROSS puede convertirse en una de las decisiones más importantes en materia de derechos de autor y competencia en Estados Unidos. Este espacio creará e involucrará discusiones gestantes entorno a la protección por derechos de autor de bases de datos, que recordemos son el insumo para entrenar programas de inteligencia artificial, y por el control y liberalización de la información legal que en principio es de dominio público. Este conflicto podrá representar un avance o retroceso en derechos de autor y competencia, que afectará la forma en que los programas de IA se entrenan y alimentan. Por lo que los problemas jurídicos que seguramente serán abordados por los jueces marcarán el camino para otros conflictos de similares magnitudes.
Para Colombia y la Comunidad Andina, este precedente se puede convertir en un camino a seguir frente a la protección de bases de datos. Sobre todo porque ni en Estados Unidos ni en Colombia se habla del derecho sui generis que hay en Europa para la protección de bases de datos que no son originales. De manera que si bien se pueden proteger por derechos de autor las bases de datos[14], la originalidad sigue siendo el único medio para protegerlas[15]. Sin embargo, en la actualidad las bases de datos pueden ser muy variadas y no necesariamente cumplen con ese requisito de originalidad dejándolas completamente desamparadas. Así que la decisión que se tome podrá guiar la discusión hacia nuevas formas de proteger las bases de datos.
Frente al tema de la competencia, cada vez más se utilizan en Colombia productos de investigación legal como Vlex, LexBase, Multilegis, entre otros, que contienen principalmente información pública y que para su acceso también se requiere de licencias[16]. Por ello, difícilmente se podría hablar de un monopolio de la información legal. Además, es importante mencionar que en Colombia el acceso a la información pública es un derecho fundamental protegido por el ordenamiento jurídico en la ley 1712 de 2014. De manera que, en principio, no deberían existir obstáculos para que los creadores de sistemas de inteligencia artificial legales obtengan la información pública que pretendan usar para entrenar sus productos.
Finalmente, enfrentarse a un gigante como Westlaw no será nada fácil para ROSS, quien paró sus actividades el 31 de enero de 2021 para centrar sus esfuerzos en combatir este litigio. En este momento sería apresurado defender conjeturas sobre un posible resultado, pues el panorama sigue aún incierto. Lo que sí está claro es que uno de los litigios más importantes en materia de derechos de autor y competencia se aproxima en los Estados Unidos.
[1] “Annual Report 2020”, Thomson Reuters, https://ir.thomsonreuters.com/static-files/da652026-f444-4d77-bdfc-93f77a3a6f79.
[2] Las preguntas se le pueden hacer a ROSS en un lenguaje natural o en voz alta gracias al reconocimiento de voz que viene incorporado en ROSS y a que utiliza el procesamiento natural de lenguaje. Sus fundadores, Andrew Arruda, Jimoh Ovbiagele han descrito a ROSS como el Siri de los abogados, incluso ROSS ha sido comparado con abogados de segundo y tercer año. En: “University of Toronto’s next lawyer: A computer program named Ross”, The Globe And Mail, https://www.theglobeandmail.com/report-on-business/industry-news/the-law-page/university-of-torontos-next-lawyer-a-computer-program-named-ross/article22054688/; “The tech start-up planning to shake up the legal world”, BBC News, https://www.bbc.com/news/business-36303705?ocid=socialflow_twitter; “Welcome To The Era Of The AI Coworker”, Wired, https://www.wired.com/story/welcome-to-the-era-of-the-ai-coworker.
[3] Son los propietarios de Westlaw.
[4] En 2017, los demandantes descubrieron que ciertos usuarios con credenciales de LegalEsase, aparentemente “bots”, descargaban y guardaban en grandes cantidades el contenido de Westlaw. Por ello, el 4 de enero de 2018, Westlaw terminó el contrato con LegalEase por incumplimiento.
[5] A través del sistema de West Key Numbers, encabezados, notas de decisión, conceptos claves, entre otras, se desarrolló un contenido con herramientas diferenciadores por parte de Weslaw. Además, explicaron que el proceso editorial era llevado a cabo por abogados y editores jurídicos, quienes organizaban y estructuraban la información para permitir el acceso a resúmenes, jurisprudencia, bases de datos, y compilaciones.
[6] 17 U.S. Code § 103.
[7] En este caso, el demandante alegó la infracción de derechos de autor por la utilización indebida de la información contenida en su directorio telefónico. La Corte determinó que el directorio telefónico no era suficientemente creativo para protegerse por derechos de autor, por lo que los datos que se copiaron del trabajo no constituyeron una infracción a los derechos de autor. Feist Publications, Inc. v. Rural Telephone Service Co., Inc. – 499 U.S. 340, 111 S. Ct. 1282 (1991).
[8] Con Feist Publications, Inc. v. Rural Telephone Service Co., Inc. se puso fin a la doctrina del “sweat of the brow”. Ello consistía en otorgar protección por derechos de autor por el esfuerzo que el autor había puesto en su obra. Sin embargo, desde dicha sentencia la originalidad, y no el esfuerzo, es la base para la protección por derechos de autor.
[9] Assessment Techs. of WI, LLC v. WIREdata, Inc. – 350 F.3d 640 (7th Cir. 2003).
[10] Además, en el caso Feist, nombrado anteriormente, la Corte fue clara en establecer que incluso si la base de datos se protege por derechos de autor como un trabajo original, dicha protección no previene a los individuos de extraer datos de la base de datos.
[11] Matthew Bender & Co. v. W. Publ’g Co. – 158 F.3d 674 (2d Cir. 1998).
[12] ProCD, Inc. v. Zeidenberg, 86 F.3d 1447 (7th Cir. 1996)
[13] La doctrina de instalación esencial se desarrolló por primera vez en la jurisprudencia estadounidense en 1977 en el caso Hecht v. Pro-Football. En esta sentencia se establecieron como requisitos para determinar la responsabilidad bajo la doctrina de las instalaciones esenciales que: (1) el control de la instalación esencial lo tuviera un monopolista; (2) la incapacidad de un competidor de duplicar de manera práctica o razonable la instalación esencial; (3) la denegación del uso de la instalación a un competidor; y (4) la viabilidad de proporcionar la instalación. La existencia de la doctrina de la instalación esencial no ha sido desarrollada ni reconocida explícitamente por la Corte Suprema de Justicia de Estados Unidos, solo por tribunales inferiores.
[14] Artículo 4 literal ll y artículo 28 de la Decisión 351 de 1993 sobre el Régimen Común sobre Derecho de Autor y Derechos Conexos y el artículo 19 de la ley 23 de 1982.
[15] En la interpretación prejudicial 10-IP-99, el Tribunal Andino explicó que las bases de datos pueden ser protegidas por derecho de autor, siempre y cuando se acredite que son originales. Dicha originalidad residirá en la composición de la base de datos, bien sea en la selección o disposición del contenido. Además, se hizo referencia a la normativa europea respecto del derecho sui generis cuando las bases de datos de datos no son originales. Sin embargo, se aclaró que ello no se había desarrollado en los países de la Comunidad Andina.
[16] Por ejemplo, en los términos y condiciones del servicio de Vlex se establece la prohibición de usar contenido para crear servicios de cualquier tipo, en especial de aquellos que puedan competir con sus servicios. Véase: “Términos y condiciones”, Vlex, https://vlex.com.co/terms-of-service/.