HORVÁTH GERGŐMi lehet a népszerű regény titka? Amerikai informatikusok erre a kérdésre keresték a választ, és könnyen lehet, hogy megtalálták.
Számítógépes algoritmussal fejtették meg a bestsellerek titkát
![](/sites/default/files/styles/image_16_10_w400/public/lead_image/ujszo_13918061151868_22.jpg.jpg?itok=roieL5EA)
HORVÁTH GERGŐ
Mi lehet a népszerű regény titka? Amerikai informatikusok erre a kérdésre keresték a választ, és könnyen lehet, hogy megtalálták. A programozók által írt algoritmusnak köszönhetően ugyanis egy kötet kiadása előtt 84 százalékos biztossággal megítélhető, hogy bestseller vagy bukás lesz-e az adott mű.
A Stony Brook University kutatói által kifejlesztett, statisztikai stilometriának nevezett technológia matematikai alapokon vizsgálja a szóhasználatot, valamint a grammatikát, és hatalmas adatmennyiséget kezelve különbséget tud tenni sikeres és sikertelen irodalmi művek között. Arra is alkalmas, hogy felismerje egyazon alkotó műveit, az egyes műfajok közötti különbséget, és rámutasson bizonyos műfaji jellegzetességekre.
A szakemberek a Project Gutenberg több mint 40 000 kötetből álló archívumából letöltött szöveget elemeztek, az eredményeket pedig az adott irodalmi alkotás idejéből származó jóslatokkal vetették össze. A kutatók a legkülönbözőbb műfajokban vizsgálódtak különböző nyelvi változók alapján, a sci-fitől kezdve a klasszikus irodalmon és filmes forgatókönyveken át a költészetig.
A Stony Brook kutatói az Amazon könyveladási toplistája alapján mérték le a könyvek sikerességét, illetve sikertelenségét. A vizsgálat kitért például Dan Brown Elveszett szimbólum című regényére is, melyet az algoritmus nem sorolt a sikeresnek vélt művek közé, mégis a bestsellerlisták élére került. A szakemberek ezt a rengeteg negatív kritika és a média figyelemfelkeltő hatásának tulajdonítják.
A kutatási eredmények arra utalnak, hogy az igék, a határozószók, valamint az idegen szavak gyakori előfordulása állhat a sikertelenség hátterében. Nagyobb eséllyel lesz bukás továbbá az olyan igéket tartalmazó regény, melyek pontosan meghatározzák az érzelmeket és a cselekvést (akart, ígért, sírt, örült), valamint nagy számban tartalmaznak közhelyes kifejezéseket (pl. szerelem).
Ezzel szemben a népszerű könyvek több kötőszót használnak (de, és, vagy), valamint olyan igéket tartalmaznak, melyek gondolati folyamatokat írnak körül (emlékezett, felismert). A Stony Brook University adjunktusa, Yejin Choi szerint az „irodalmi művek sikerének előrejelzése hatalmas dilemma a kiadók és a feltörekvő írók számára. A mi munkánk az első a sorban, amely kvantitatív alapon mutat ki kapcsolatot az alkotás nyelvezete és sikere között.”
A kutató arra is kitért: az újságírók az átlagosnál több főnevet, névmást és elöljárószót használnak, mivel ezek több információt közölnek. „Azok a regényírók, akik az újságírókhoz hasonlóan fogalmaznak, sikeresebbek az irodalomban” – fogalmazott Choi. Figyelemre méltó megállapítás ez, tekintettel arra, hogy a világirodalom számos nagy írója, például Dickens és Hemingway is újságíróként kezdte a pályafutását.
A kutatás eredményeit néhányan kritikusan fogadták, szerintük még egy ilyen összetett algoritmus sem képes tartalmi szempontok alapján értékelni egy alkotást. Ezt maga Choi is elismerte, mivel azonban az algoritmus nagy százalékban helyes jóslatokat hozott, úgy tűnik, nem feltétlenül a tartalmi szempontokban rejlik a népszerű irodalmi alkotás sikeressége.
Támogassa az ujszo.com-ot
A támogatásoknak köszönhetöen számos projektet tudtunk indítani az utóbbi években, cikkeink pedig továbbra is ingyenesen olvashatóak. Támogass minket, hogy továbbra is függetlenek maradhassunk!
Kérjük a kommentelőket, hogy tartózkodjanak az olyan kommentek megírásától, melyek mások személyiségi jogait sérthetik.