Tutkijat paljastavat antiikin sosiaaliset verkostot AI: n ja röntgensäteiden avulla


Taitettu ja suljettu Punaisen vaha-arkin kanssa Catharuçia Savonario Rivoalin tahto oli Venetsian valtionarkistossa, lukemattomassa, yli kuusi ja puoli vuosisataa. Tutkijat eivät tiedä, miksi 1351 kirjoitettua asiakirjaa ei koskaan avattu. Fyysikko Fauzia Albertinille kolmen sivun dokumentti – kuusi sivua, taitettu – oli täydellinen pituus koetta varten.

Albertin, joka nyt työskentelee Enrico Fermi -tutkimuskeskuksessa Italiassa, halusi lukea tahtoa purkamatta sitä. Hänen lähestymistapa: X-ray-visio. Vuonna 2017 esittelyssä Albertin ja hänen tiiminsä virittivät röntgenkuvat asiakirjassa valokuvan ottamiseksi sisälle. Sitten, käyttämällä algoritmeja, ne kuoriivat digitaalisesti kuusi sivua käsin kirjoitettujen sanojen toistettavaksi.

He eivät ole tajunnut täysin, mitä asiakirja sanoo. Rivoalti käytti vanhaa italialaista muotoa, jota heidän arkistonhoitajansa yhteistyökumppanit tulkitsevat edelleen, Albertin sanoo. (He purkivat osan siitä: Yhdessä kappaleessa Rivoalti toteaa, että hänen tahtonsa on kirjoitettu laadukkaalle paperille, mahdollisesti muistuttaakseen lukijaa siitä, että hän on varakas.) Mutta tekniikan pitäisi auttaa historioitsijoita tutkimaan tekstejä vahingoittamatta itse fyysisiä esineitä . ”Ainoa muu tapa lukea [the will] on leikata se auki ”, Albertin sanoo.

Albertin tekee yhteistyötä suurempana projektina, joka tunnetaan nimellä Time Machine, jonka tavoitteena on luoda Googlen kaltainen hakukone, joka kattaa 2000 vuotta Euroopan historiaa. Tätä varten tutkijat aikovat digitalisoida ja järjestää Euroopan kaupunkien arkistot yhdeksi tietokannaksi, kertoo École Polytechnique Fédérale de Lausannen tietotekniikan tutkija Frédéric Kaplan, joka johtaa Time Machine -yhteistyötä. Lopulta Kaplan uskoo, että historioitsijat voisivat skannata suljettujen tomeiden kirjastoja käyttämällä Albertinin röntgenkuvaustekniikoita enimmäkseen automatisoidussa prosessissa. Ne voisivat sitten syöttää nämä skannaukset AI: n ohjaamalle tekstintunnistusalgoritmille, jonka tiimi kehittää, mikä syöttää tekstin automaattisesti tietokantaan.

Kaplanin suurimmassa muodossaan se kuvailee Time Machine -karttaa, jossa voit esimerkiksi lähentää 1800-luvun Pariisin naapuruston kadunäkymää. Heillä on korkealaatuisia ilmakuvia Pariisista tuona aikana. Jotta kaupunkia voitaisiin levittää eteenpäin ajassa, Kaplan uskoo voivansa käyttää AI: tä, joka on koulutettu historiallisen kaupunkisuunnittelutiedon avulla, tekemään koulutettuja arvauksia siitä, miten katutasot ovat kehittyneet. Viime kuussa Euroopan unioni myönsi joukkueelle miljoonan euron siemenrahoituksen näiden menetelmien kehittämiseksi, ja Time Machine on yksi kuudesta tieteellisestä hankkeesta, jotka kilpailevat tällä hetkellä miljardin euron eurooppalaisesta rahoituksesta seuraavan vuosikymmenen aikana.

Aikakone ei kuitenkaan ole vain räikeä sovellus. Sen valtavan tietokannan pitäisi antaa historioitsijoille mahdollisuus tutkia yhteiskunnallisia malleja pidemmillä ajanjaksoilla ja maantieteellisillä asteilla. Hanke on osa viime vuosien viimeaikaista kehitystä, jossa useammat historioitsijat ovat yrittäneet käyttää tietojenkäsittelytietoa uuden tiedon keräämiseen vanhoista teksteistä. Kun historioitsijat ehdottavat avustushankkeita, se on lähes a [requirement] että teet tietokannan ja teet joitakin verkkoanalyysejä ”, sanoo Itävallan tiedeakatemian historioitsija Johannes Preiser-Kapeller.

Esimerkiksi Leidenin yliopiston historioitsija Hilde De Weerdt ja hänen tiiminsä ovat rakentaneet työkalun, joka tunnistaa automaattisesti nimet, paikat ja ajat digitoiduissa kiinalaisissa ja korealaisissa teksteissä. He ovat suunnitelleet tietokannan, jotta se voi yhdistää karttapohjaiseen ohjelmistoon, ja he voivat helpommin visualisoida, miten ihmiset ja ajatukset muuttavat avaruudessa ja ajassa.

Tämä tietopohjainen lähestymistapa voi tarjota uuden näkökulman menneisyyteen. Perinteisesti historioitsijat käyttävät kertomuksia ymmärtääkseen menneisyyden ja keskittämään tutkimuksensa ”suurille miehille ja suurille paikoille”, sanoo Preiser-Kapeller. Tämä kehys voi johtaa kirsikointiin, jossa tutkijat korostavat vain tapauksia, jotka tukevat heidän kertomustaan. Cherry-picking tapahtuu edelleen usein historiallisessa apurahassa, hän sanoo.

Tietotiede suojelee jotakin tätä subjektiivisuutta vastaan. ”Kun keräät järjestelmällisesti todisteita ja asetat sen tietokantaan, pääset pois kirsikoista”, sanoo Preiser-Kapeller. Se voi siirtää historioitsijat pois hallitsevista kertomuksista. Esimerkiksi Preiser-Kapeller on kartoittanut verkot tunnistamaan tärkeimmät toimijat, jotka eivät ole merkittäviä ensimmäisessä käsittelyssä, Bysantin Empire-asiakirjoissa. ”He eivät olleet äänekkäimpiä ihmisiä, mutta he olivat aina taustalla, ja ne yhdistivät ihmisiä, jotka eivät ehkä muuten olleet yhteydessä toisiinsa”, hän sanoo.

Jopa suhteellisen yksinkertaiset tietoprojektit voivat tuottaa uusia historiallisia oivalluksia. Sheffieldin yliopiston historioitsija Máirín MacCarron on kirjoittanut 600 merkkiä manuaalisesti 8-luvun tekstiin. Englannin kansan kirkollinen historia, valtavaan Excel-laskentataulukkoon. Hän ja hänen tiiminsä ovat myös tallentaneet jokaisen näiden merkkien välisen vuorovaikutuksen. ”Meillä on jopa luokka postmortem-vuorovaikutuksille”, sanoo MacCarron. "Koska nämä ovat keskiaikaisia ​​uskonnollisia tekstejä, meillä on pyhiä, jotka palaavat ja tekevät ihmeitä."

MacCarron tutkii erityisesti, miten naiset suhtautuvat tekstiin. Perinteinen apuraha saa naiset rauhanomistajiksi, mikä estää konflikteja naimisiin naapurivaltion hallitsijan kanssa. Mutta verkkoanalyysi voi paljastaa monimutkaisempia rooleja, sanoo MacCarron. Joissakin varhaisissa analyyseissä hän on havainnut, että kahdestatoista kaikkein yhteiskunnallisesti yhdistetyimmistä merkistä tekstistä kolme on naisia. ”Kun piirrät vuorovaikutukset matemaattisesti, saatat huomata, että merkillä on yhteysverkko, jota et katsonut normaalista lukemisesta”, MacCarron sanoo.

Kaikki historioitsijat eivät ole vakuuttuneita lähestymistavan eduista. ”Kun aloin käyttää sitä, ajattelin, että se olisi paljon tehokkaampi kuin se osoittautui”, sanoo historioitsija Michal Biran Jerusalemin heprealaisesta yliopistosta, joka on luonut tietokannan ja kartoittanut Mongolin valtakunnan sosiaaliset verkostot 13. päivän aikana ja 14. vuosisata. Visualisoinnit näyttävät melko esityksissä, Biran sanoo, mutta ne kestävät kauan aikaa, eikä hän ole kyennyt kertomaan niistä paljon tieteellistä tietoa.

Biranin vaikeudet saattavat johtua hänen lähdemateriaalinsa kirjoista. Koska hyvin vähän mongolilaisia ​​kirjoituksia on säilynyt, hän tutkii pääasiassa mongolien keisarillisten aiheiden kielellä kirjoitettuja asiakirjoja. Usein tämä tarkoittaa työtä kiinalaisten, persialaisten ja venäläisten tekstien kautta. Hahmoilla on eri nimet eri kielillä, ja usein jopa useita nimiä samassa kielessä – mies voi kutsua erilaisia ​​kunnianosoituksia esimerkiksi elämän eri kohdissa. Se vaatii tarkkaa tutkimusta pitääkseen nimet suorina, mikä tekee niistä vaikeaa lajitella digitaalisesti siistiksi laatikoiksi, Biran sanoo.

De Weerdt huomauttaa, että vaikka lähdekoodin teksti kääntyy helposti digitaalisiin tietoihin, tietojen analysointi ei vieläkään kestä yksinään. Viime kädessä historialliset tutkimukset perustuvat teksteihin ja "mitä enemmän toteutat matemaattisia prosesseja, sitä enemmän saat tekstistä", hän sanoo. Jotta ymmärrätte todella ensisijaisten asiakirjojen hienoudet, tarvitset edelleen perinteisten historioitsijoiden erikoisosaamista.

”Olemme yleensä harvoin lopullisia historiassa,” sanoo MacCarron. ”Kaikki on subjektiivinen. Jokainen lähde paljastaa jossain määrin kirjailijan puolueettomuuden. ”Mutta yhdistämällä historialliset lähteet ja analysoimalla niitä rinnakkain, ehkä voitte keskittää joitakin näistä puolueellisuudesta – ja lähestyä totuutta.


Lisää suuria WIRED-tarinoita