MI-alapú keresők kevésbé népszerű forrásokra támaszkodnak – új kutatás tárta fel a különbségeket
MI-alapú keresők kevésbé népszerű forrásokra támaszkodnak – új kutatás tárta fel a különbségeket
Az MI-alapú keresőmotorok nemcsak másképp működnek, mint a hagyományos keresők, hanem teljesen más forrásokra is építenek – derül ki a Ruhr Egyetem (Bochum) és a Max Planck Szoftverrendszerek Intézet legújabb kutatásából. A „Characterizing Web Search in The Age of Generative AI” című tanulmány szerint a mesterséges intelligenciával működő keresések sokkal gyakrabban idéznek kevésbé ismert weboldalakat, amelyek gyakran még a Google hagyományos találati listájának Top 100 helyezettjei közé sem kerülnek be.
MI-keresők és a hagyományos Google-eredmények közti eltérések
A kutatók összehasonlították a Google klasszikus keresési találatait a vállalat AI Overviews funkciójával, valamint a Gemini-2.5-Flash és GPT-4o alapú keresési rendszerekkel. Az elemzés során külön vizsgálták a „GPT-4o Search Tool” működését is, amely csak akkor keres a weben, ha a nyelvi modell a saját tanult adataiban nem talál releváns információt.
A keresésekhez több forrásból származó kérdéseket használtak, köztük a ChatGPT WildChat adatbázisából, politikai témalistákból (AllSides), valamint az Amazon legkeresettebb termékei közül válogatott példákból.
Kevésbé népszerű források, eltérő rangsor
A Tranco domain-rangsor alapján az MI-alapú keresők által hivatkozott oldalak sokkal ritkábban estek a top 1 000 vagy akár top 1 000 000 legnépszerűbb webhely közé. Különösen a Gemini kereső mutatott erős hajlamot arra, hogy alacsony forgalmú domaineket idézzen.
A Google AI Overviews találatai között a források 53%-a nem szerepelt a Google top 10 találatában, 40%-uk pedig még a top 100-ban sem.
Nem feltétlen rosszabb – csak más
A kutatók hangsúlyozták, hogy az eltérések nem feltétlenül jelentik azt, hogy az MI-keresések „rosszabbak”. A GPT-alapú rendszerek gyakrabban idéznek vállalati weboldalakat és enciklopédiákat, míg szinte soha nem támaszkodnak közösségi médiás forrásokra.
Egy mesterséges intelligencián alapuló elemző eszköz kimutatta, hogy az MI-keresések általában ugyanannyi egyedi fogalmat fednek le, mint a hagyományos találatok – tehát az információ részletessége és sokszínűsége hasonló.
Ugyanakkor a generatív keresők hajlamosak az információ „tömörítésére”, ami miatt bizonyos mellékes vagy kétértelmű részletek kimaradhatnak. Ez különösen problémás lehet olyan keresések esetén, ahol többféle értelmezés lehetséges (például azonos nevű személyek esetén).
Az MI tudáselőnye és korlátai
Az MI-keresők előnye, hogy saját tanult tudásukat is ötvözhetik a weben talált adatokkal. A GPT-4o Search Tool gyakran teljes választ adott anélkül, hogy bármilyen webes forrást idézett volna – pusztán a modell előzetes ismereteire hagyatkozva.
Ez azonban hátránnyá válhat az aktuális, időérzékeny információk esetén: a kutatók szerint például a „trending” keresésekre a GPT-4o sokszor nem adott releváns választ, inkább további információt kért a felhasználótól.
Új értékelési módszerekre van szükség
A tanulmány szerzői nem ítélték meg, hogy az MI-alapú keresés „jobb” vagy „rosszabb” lenne a hagyományosnál. Ehelyett arra hívták fel a figyelmet, hogy a jövőben új mérési és értékelési módszerekre lesz szükség, amelyek figyelembe veszik a források sokszínűségét, a fogalmi lefedettséget és a generatív összefoglalás módját is.