Mivel az élvonalbeli cégek adatbázisai hatalmas méretűek és bonyolult szerkezetűek, ezért a szakértők számára is nehézséget okoz az összefüggések kihámozása. Emiatt egyre többen kezdik el alkalmazni az úgynevezett gépi tanulási módszereket. Ezek olyan speciális programok, amelyeknek ha kellő mintát mutatunk, elkezdenek maguktól felfedezni összefüggéseket, amelyeket új minták esetén is tudnak alkalmazni (hasonlóan ahhoz, ahogy egy iskolás is példákkal tanul a dolgozatírásra).
Például ha sok Facebook-profilt mutatunk a gépi tanulási programnak, ahol azt is megmondjuk, hogy az illető mennyire volt jó vagy rossz hitelfizető, akkor képes lesz azoknak a – sok esetben nüansznyi – részleteknek a felismerésére, amelyek alapján maga a gép döntést tud hozni a hitelkérelmek minősítésénél. Így a későbbiekben olyan esetekben is pontos hitelbesorolásra lesz majd képes, ahol az igénylő megbízhatósága nem ismert.
Erre szolgáltat példát a Fico nevű hitelképesség-értékelő cég, ahol a rossz és jó adósok Facebook-profiljait vizsgálják. A cég vezérigazgatója nemrég azt nyilatkozta, hogy „ha azt nézzük, hogy valaki hányszor írta a (Facebook) profiljában, hogy »ki vagyok ütve«, az mindenképpen bír valamennyi jelentősséggel a hitelképessége szempontjából.”
Kik és hol használják?
A gépi tanulási módszerek sokkal univerzálisabb, új eszköztárat jelentenek az informatikában, mint a fenti példa. Számos feladatot sokkal hatékonyabban képesek végrehajtani, mint a hagyományos programok: ilyen például az objektum- és arcfelismerés képeken és videókon vagy képek szöveges jellemzése. Nem véletlen, hogy a nagyobb tech-cégeknek, mint a Facebook vagy a Google, saját gépi tanulással foglalkozó kutatócsoportja van. Ezek a maguk nemében sem számítanak kicsinek, például a Facebook FAIR elnevezésű kutatócsoportja jelenleg 50 fős, de duplájára tervezik bővíteni.
A kutatások fókuszában sokszor (de nem kizárólag) az idegrendszer működését utánzó úgynevezett mesterséges neurális hálózatok alkalmazása áll, amelyeket már ma is megtalálhatunk egyes szolgáltatásokban, termékekben. A legújabb Google Translate alkalmazásban egy neurális hálózat dolgozza fel a kamera képét, hogy az ott megjelenő szöveg karaktereit kiolvassa. Ezek után egy másik neurális hálózat fordítja le a szöveget a kívánt nyelvre. Ugyanúgy neurális hálózatok felelősek a Google autóinak biztonságos vezetéséért is: ezek ismerik fel és jellemzik az autó látóterébe kerülő objektumokat.
Ezeknek az eljárásoknak az érdekessége, hogy sok esetben ki is tudják fejezni, amit megtanultak. Például egy házszámot felismerő neurális hálózat képes házszámokat ábrázoló képeket „festeni”, vagy egy zenére „hangolt” hálózat új zenék „komponálásra” is képes. Bár ezek sokszor kevésbé élvezetesek, mint az eredetiek, de meglepően jól utánozzák az igazit. Ebben az az érdekes, hogy a mesterséges neurális hálózat nem kap magyarázatot a megértendő anyagok mellé, hanem csupán a nyers tartalom alapján képes lesz absztrakt fogalmak használatára (lásd keretes írásunkat!).
Bár elég elvontnak tűnik a mesterséges neurális hálózatok fogalma, nézzük meg egy egyszerű példával, hogy milyen elven működik az egyik típusuk, az arcfelismerésre használt hálózat. Ahogyan az agyunkban az idegsejtek, a neuronok hálózatot alkotnak, a mesterséges neuronokat is hálózatba szervezik, amelyben a szomszédos neuronok egymás felé jelzéseket küldenek, ha bizonyos inger éri őket. A képfelismerésnél az egyik trükk az, hogy többrétegű hálózatot alkalmaznak, így a hálózat a felismerési problémát részekre tudja bontani. Míg az első réteg csak a nyers képet „látja”, a második réteg képes érzékelni, hogy azon hol helyezkednek el élek és további vonások. A második réteg jelentéséből pedig a harmadik réteg képes felismerni összetettebb objektumokat, mint a szemek vagy a száj, és ebből végül összeáll a végső kép.