Da Roma, Italia: il Workshop DESI V sulla codifica predittiva, l’apprendimento automatico ed un’ esamina dell’e-discovery [CORRELATO CON VIDEO-INTERVISTE]

Home / Uncategorized / Da Roma, Italia: il Workshop DESI V sulla codifica predittiva, l’apprendimento automatico ed un’ esamina dell’e-discovery [CORRELATO CON VIDEO-INTERVISTE]

 

  [ traduzione a cura di Valentina Agostinelli ] 

[ To read this post in English click here ]

Redatto da: Gregory P.Bufithis, Avvocato, Fondatore e Presidente del Project Counsel Group 

(con un ringraziamento speciale all’Avv. Ryan Costello, nostro consulente con base in Italia, che ha condotto le video-interviste riportate sotto, contribuendo inoltre con la sua preziosa analisi dell’evento)

22 Luglio, 2013 – La quinta edizione del Workshop DESI si è tenuta a Roma, Italia, il mese scorso. Ha fatto parte della 14esima Conferenza Internazionale sull’Intelligenza Artificiale e il Diritto (ICAIL 2013), ed è stata sponsorizzata dal Consiglio Nazionale delle Ricerche Italiano (CNR).

L’ICAIL è promossa dall’ Associazione Internazionale per lo studio dell’Intelligenza Artificiale e il Diritto (IAAIL) della quale siamo stati membri a lungo. L’IAAIL è un’organizzazione devota alla ricerca e lo sviluppo nel campo dell’intelligenza artificiale ed il diritto con membri attivi in tutto il mondo. Il CNR è il più grande istituto pubblico di ricerche in Italia, l’unico sotto il Ministero dell’istruzione, dell’Università e della Ricerca che lavora in attività multidisciplinari. La sua missione principale è quella di fare ricerca all’interno del suo stesso istituto, promuovendo l’innovazione e la competitività nel sistema industriale italiano.

La sede di Roma non poteva essere migliore. Il nostro ufficio italiano si trova a Frascati, una cittadina a circa 20 km a sud-est di Roma, nella regione Lazio. L’abbiamo scelta per la sua associazione con la scienza e la tecnologia, essendo la sede di molti laboratori scientifici internazionali che includono l’ENEA ( Ente per le Nuove Tecnologie, l’Energia e l’Ambiente), l’INFN ( Istituto Nazionale per la Fisica Nucleare) e l’ESA ( l’Agenzia Spaziale Europea). E’ inoltre un grandissimo centro culturale, mediatico ed artistico. Rinomato inoltre per il suo vino bianco squisito, il Frascati Superiore, che sicuramente ha avuto molta influenza nella mia decisione finale.

Ho un collegamento ormai duraturo con l’italia dovuto al mio lavoro nell’industria della moda ( mia moglie lavorava per Versace) nell’area relativa alle cause legali legate alla proprieta’ intellettuale, cosi’ come la gestione generale di quest’ultima.

Inoltre ogni anno spediamo un membro del personale alla “Summer School on Law and Logic”, tenuta dall’Istituto dell’Universita’ Europea ( European University Institute) a Firenze, e sponsorizzata dalla Harward Law School e dalla Cirsfid- Universita’ di Bologna. Le sessioni estive di quest’anno sono estremamente attuali: un’introduzione sulla struttura delle prove giudiziarie che confronta gli Stati Uniti con i rappresentanti del sistema giuridico europeo, ed una serie di classi sul confronto/uso del metodo Bayesian, sugli approcci basati su argomentazione e comunicazione nella presentazione legale di un caso. Centro!

Ma la mia esperienza legale piu’ importante in Italia mi ha visto coinvolto in diverse controversie legate allo scaldalo della Parmalat, che somiglia per complessita’ e ripetitivita’ agli argomenti da me affrontati sul caso dello scandalo commeriale della Socie’te’ Ge’ne’rale/Jerome Kerviel. La Parmalat ha generato complesse questioni di bancarotta fraudolente, aggiotaggio e responsabilita’ delegata per le organizzazioni contabili internazionali ed i loro studi legali associati, ecc.

Lo scandalo del processo Parmalat e’ il risultato del collasso della stessa nel 2003, sia in Italia che negli Stati Uniti, a seguito della scoperta di una frode di proporzioni gigantesche, con un falso in bilancio stimato intorno ai 10 miliardi di $, e l’enfasi eccessiva data agli attivi societari calcolati in 16 miliardi di $. Venuto alla luce poco dopo la truffa della Enron e della WordCom, lo scandalo della Parmalat è stato una ottima opportunita’ di mettere a confronto I fallimenti avvenuti su entrambi i lati dell’Atlantico. In Italia il caso Parmalat è stato chiamato “il fallimento dei guardiani”, con i riflettori puntati sui revisori contabili Deloitte Touche e Grant Thornton, e sulle banche. I guardiani finanziari non hanno mai mostrato particolari motivi di preoccupazione in Italia, anche se la normativa vigente nel campo è in verità ben determinata; l’applicazione che poi se ne fa risulta essere molto scarsa. Infatti, in particolare il diritto civile riportato nei testi sul tema della revisione contabile, è molto più rigoroso di quello statunitense ed inglese. Ma questa mancanza di controlli nell’applicare la legge è stata la ragione per cui la Parmalat ha generato un processo negli Stati Uniti. La popolazione italiana è venuta a conoscenza di azioni collettive scatenatesi negli States dopo il collasso della società, intraprese dalla categoria degli avvocati, e che queste azioni coinvolgevano investitori italiani insospettabili. E se si seguivano i notiziari sia in America che in Italia, spesso ricorreva il detto di Lord Denning “ la falena è attratta dalla luce così come l’America attira processi legali”. E’ apparso chiaro il bisogno di manodopera intellettuale specifica in Italia, e avendo io come base lavorativa l’Europa, avendo una lista di contatti di legali e paralegali italiani, conoscendo la maggior parte degli studi legali coinvolti, sono stato in grado di creare un team di lavoro di revisione ed investigazione. Da qui nasce la nostra unità operativa europea di revisione documentale, la e-discovery.

Attraverso il lavoro e l’analisi dei vari casi, sono stato presentato all’Istituto Federale di Tecnologia svizzero, attore principale nel settore dell’intelligenza artificiale, apprendimento automatico, reti neurali artificiali e analisi predittiva. Come ho mostrato in diversi miei scritti, l’istituto spesso collabora con l’IBM Research di Zurigo, il ramo europeo dell’ “IBM Research”, in aree di scienze computazionali/scienze dell’informazione ed ha presentato numerosi studi sulle scienze dell’informazione correlate al recupero dei dati alla EU Corporate Law Making Conferences, cosponsorizzata con l’Universita’ di Harvard.

ICAIL 2013

L’intera settimana dell’ICAIL 2013 è stata in realtà molto interessante. Al di fuori del workshop DESI, si e’ tenuta una sessione brillante sull’ “Introduzione all’Intelligenza Artificiale e Diritto” di Kevin Ashley e Matthias Grabmair. Kevin è professore di diritto e di “Intelligent Systems” presso l’Università di Pittsburgh e molti di noi lo conoscono per il suo lavoro sui concetti di ontologia nel campo del diritto. Matthias è candiditato al dottorato di ricerca nel “Programma dell’Intelligent Systems” presso l’Università di Pittsburgh. Si sono tenute, inoltre, sedute sulla estrazione di informazioni dai testi delle fonti legali, argomentazione nell’intelligenza artificiale e diritto, oltre ad una sessione affascinante sulla ” Network Analysis in Law “, che ha riunito i ricercatori nell’ambito della scienza sociale computazionale, la teoria legale computazionale, la scienza dei sistemi di rete e delle discipline correlate, al fine di discutere l’uso e l’utilità dell’analisi dei network nel settore giuridico.

Il mio preferito è stato un documento di analisi della IP ( sono un estimatore del concetto di proprietà intellettuale ) dal titolo ” Identifying Patent Monetization Entities ” di Mihai Surdeanu e Sara Jeruss della Lex Machina. Esso descrive una serie di dettagli tecnici del loro sistema Patent Troll Identification, ed il modo scrupoloso in cui questo e’ stato valutato e l’analisi degli errori che ne e’ seguita (per il link della presentazione clicca qui e per il link del documento clicca qui). Le aziende stanno pagando importi significativi per avere la licenza all’uso del software e la LexMachina ha appena avuto un risultato molto buono nel bando di gara per il finanziamento (per saperne di piu’ clicca qui).

Ma la presentazione che piu’ ha avuto risalto e’ stata quella di Oahn Thi Tran, vincitrice del Premio Donald H. Berman per il Migliore Studio come studente. Il suo giornale, “Reference Resolution in Legal Texts”, e’ stato co-redatto da Minh Nguyen Le e Akiri Shimazu e focalizzato sulla risoluzione di termini, definizioni e disposizioni di documenti legali in lingua Giapponese. Oahn Thi Tran è una dottoranda vietnamita presso l’Istituto Giapponese di Scienza e Tecnologia. Parla correntemente vietnamita, giapponese ed inglese. E con l’inglese come terza lingua, lei e’ semplicemente geniale, articolata e dettagliata. Ottimo lavoro!

DESI V

DESI…Discovery of Electronically Stored Information… venne concepito da Jason R. Baron e Doug Oard nel 2007. Doug è professore presso il college degli Studi sull’Informazione nell’Università del Maryland. La maggior parte dei lettori riconoscerebbe il suo nome dalla serie “Pensare in grande” (Thinking Big), parte del progetto Storia Orale nell’Era Digitale fondato dall’Istituto dei Servizi Museali e Bibliotecari. Sotto riportiamo un breve video tratto dalla serie, dove Doug parla dello stato attuale del riconoscimento dell’automatic speech e delle sue applicazioni alla storia orale:

 

Jason, per il nostro neuroscienze e membri di intelligenza artificiale che ricevono questo, è il Direttore  presso l’Amministrazione Nazionale Degli Archivi e Registri delle controversie negli States, uno dei maggiori organizzatori della conferenza di Sedona, uno dei fondatori e coordinatori del TREC Legal Track; solo per citarne alcuni. Per il CV completo clicca qui.

Cosa aveva in mente Jason quando ha concepito DESI? Come detto da lui “ Pensavo ad un forum che avrebbe essenzialmente portato fuori Picasso ed Einstein a cena insieme: docenti con dottorato in Recupero dei Dati ed Intelligenza Artificiale, insieme a rappresentanti legali ed avvocati, uniti nel tentativo di procedere con l’introduzione di fonti più avanzate e sofisticate e di revisione dei metodi nell’ambito della e-discovery”.

Questa quinta edizione ha posto il suo focus sugli standard nell’utilizzo della codifica predittiva, l’apprendimento automatico ed altri metodi di revisione e ricerca nella e-discovery. L’obiettivo dei metodi analizzati è quello di includere possibili applicazioni a livello di automazione ad ogni aspetto della e-discovery ( valutazione iniziale dei casi, la revisione di documenti rilevanti, revisione del segreto professionale) con lo scopo di migliorare l’accuratezza e ridurne i costi. Il workshop è nato con l’intento di incrementare i dibattiti scauriti dai forum precedenti dell’ICAIL/DESI, nel promuovere l’uso dell’Intelligenza Artificiale ed altre forme avanzate di tecniche di ricerca in ambito legale, come alternative – in termini di efficienza dei costi – al tradizionale Boolean e alla ricerca manuale.

Il discorso riprende da dove il IV Seminario DESI di Pittsburgh lo aveva interrotto, concentrandosi sui metodi e gli standard più idonei all’utilizzo della codifica predittiva, l’apprendimento automatico e altri metodi di ricerca avanzata e di revisione nella e-discovery. L’edizione di Roma è stata caratterizzata da una discussione vivace ed entusiasta, un dare e avere durante tutta la giornata, in particolare durante la sessione di breakout all’ora di pranzo e il pannello pomeridiano finale presieduti da Debra Logan di Gartner Research. Come Jason ha ribadito più volte, “abbiamo bisogno di ottenere information retrieval (IR), scienziati e docenti universitari di diverse discipline nella stessa stanza insieme agli avvocati, due categorie di persone che normalmente non parlano l’un l’altro”. Con l’emergere continuo di nuove tecnologie e progressi nei metodi di ricerca nello spazio della e-Discovery, è immensamente importante, come dice Jason “promuovere un dialogo tra studiosi della IR che sanno molto sull’argomento, e gli avvocati” per “scoprire un po’ di più su come questi strumenti funzionano realmente”. L’obiettivo di questo esercizio è, naturalmente, di discutere, valutare e forse proporre nuove norme per il settore emergente della codifica predittiva.

Abbiamo avuto l’occasione di intervistare Jason dopo la fine dell’evento per andare attraverso la serie dei workshop DESI, investigando alcune delle tecnologie in questione, e menzionando la sua carriera ed il suo ruolo alla “National Archives”:

 

 

Se, infatti, gli obiettivi del Workshop hanno ambito a promuovere ed aprire nuove strade nel discutere gli standard e potenziali metodi più adatti, DESI V di certo non ha deluso.

Il discorso si è delineato durante tutta la giornata attraverso una serie di settori diversi: da come misurare e massimizzare la riduzione degli errori nei processi di classificazione di testi, come presentato da Fabrizio Sebastiani dell’Istituto di Scienza e Tecnologia dell’ Informazione (uno dei leader nel mondo nella classificazione del testo); alla recente decisione della Corte (da Silva Moore e in Re Actos, tra gli altri), la trasparenza tra le parti in questione, e la necessità di utilizzare le migliori pratiche nell’efficacia della revisione legale, come discusso dai relatori del Keynote Conor Crowley e Bill Butterfield, così disponibili da rilasciare un’ intervista durante il Workshop per discutere le loro intuizioni sugli ultimi studi effettuati Reality Bites: Why TAR’s Promises Have Yet to be Fulfilled:

 

 

Altrettanto affascinante è stata la presentazione di Simon Attfield e Lawrence Chapin sulla necessità di stilare un resoconto nel processo della e-discovery, parte del loro studio intitolato Predicative Coding, Story Telling and God (discusso nel blog di Ralph Losey, dove è possibile accedere cliccando qui).

 

Per tutti gli studi presentati al DESV V, clicca qui.

Nota: Jason ha stilato la sua recensione del DESI V con alcuni commenti dettagliati su molti dei lavori presentati, disponibili da ora sul blog di Ral (clicca qui).

 

 

Quindi, cosa delle pratiche vincenti e dei valori fin qui studiati utilizziamo per il mondo inesplorato della codifica predittiva e la tecnologia “vector machine” nella e-Discovery? A che punto siamo dopo DESI V? Mentre ci sono una varietà di diversi punti di vista sulla questione, sembra chiaro che gli standard possano aggiungere un livello di qualità , ed effettivamente potrebbero anche essere diversificati … potrebbero esistere standard delineati per gli addetti alla vendita, pratiche più definite per gli avvocati, e così via. Parafrasando Tom Barnett, che ha presentato il suo studio Similar Document Detection and Electronic Discovery: So Many Documents, So Little Time durante la sessione del mattino, e come lo stesso Jason tocca nell’intervista di cui sopra, ad un certo livello di astrazione è possibile avere uno standard che sia giusto in generale, ma la chiave è non “ricadere su se stessi” in termini di andare troppo nello specifico. Con discussioni di qualità, un’adeguata cooperazione nel settore ed un accordo su quali siano le migliori pratiche, potremmo  essere in grado di unirci attorno ad una modalità unica che abbia un senso condiviso.

 

Post scriptum: abbiamo anche avuto l’opportunità di incontrare il nostro gentile ospite, Enrico Francesconi dell’Istituto di Teoria e Tecniche dell’Informazione Giuridica, un organo del CNR, per un Q & A in Italiano sull’istituto e per sondare quali siano stati per lui i punti di maggior rilevanza della Conferenza:

 

Related Posts