Näib, et ChatGPT ja selle järglane GPT-4 on pähe õppinud suure hulga autoriõigustega kaitstud raamatuid, mis tekitab küsimusi suurte keelemudelite (LLM) loomise seaduslikkuse kohta.
Tellijale
NEW SCIENTIST ⟩ Potentsiaalne kohtuküsimus – ChatGPT loeb «Harry Potterit» ilma loata
Mõlemad tehisintellektid töötas välja eraettevõte OpenAI, kus neid treeniti tohutu andmehulgaga. Millised tekstid täpsemalt koolitusandmed moodustavad, pole aga teada.
Lisateabe saamiseks uurisid David Bamman ja tema kolleegid California ülikoolist Berkeleys, kas tehisintellektid suutsid täita puuduvad üksikasjalikud lüngad peaaegu 600 ilukirjandusliku raamatu valikust.