A Samantha-hatás: közelebbről a robotok jövőjére

2013-ban a Spike Jonze kiadta az indie-sci-fi-dráma-romcom „Her” című kiadványát.

A film követi a világ első mesterségesen intelligens operációs rendszerének, a Samanthanak az evolúciós pályáját.

Scarlett Johansson félrevonja, hogy Samantha minden fejlesztő álmodozása: a „valódi” mesterséges intelligencia (AI) tökéletes példája. Lenyűgöző beszélgető, felfogja a kontextust, a természetes nyelvet, az érzelmeket és a józan észt.

Nyilvánvaló, hogy a modern botok nem egészen Samantha szintjén vannak. A legjobb esetben képesek konkrét eredményeket kínálni egy társalgási felületen keresztül. A legrosszabb esetben ők - a telefonod a falhoz képest - csalódnak.

Mivel a technológia villámsebességgel fejlődik, elmozdulhatnánk-e egy olyan korszak felé, ahol létezhet egy Samantha-szerű bot?

Érzelmileg intelligens adatok

A mai AI ötvözi a szimbolikus feldolgozást (AI egyértelmű szabályokat és logikát használva) a gépi tanulással oly módon, hogy kihasználja az erősségeiket és csökkentse gyengeségeiket.

Például a szimbolikus feldolgozás segítségével meghatározhatjuk azokat az ismereteket és viselkedéseket, amelyeket nehéz lehet megtanulni az adatokból. A gépi tanulás kiegészíti ezt azzal, hogy segíti a rendszert a váratlan helyzetekhez és az új koncepciókhoz való alkalmazkodásban.

Ez a kombináció a tanulási folyamat felgyorsításán túl hasznos tulajdonságokkal is rendelkezik. A jövőben lehetőséget adhatna nekünk arra, hogy az emberekkel való emberi interakcióban a robotokkal kapcsolatba lépjünk.

Mivel a gépi tanulás minden vonzó tulajdonsága ellenére alapvetően statisztikai folyamat. Ez azt jelenti, hogy tükrözi az adatok minőségét, amelytől függ.

Ez áldás és átok. A gépi tanulás érzékenysége a bemeneti adatok jellemzőire azt jelenti, hogy könnyen megtanulhatja a rossz dolgokat, amint azt Tay, a Microsoft rasszista robotja is kimutatta.

Azt is vitatják, hogy a gépi tanuláshoz kiválasztott adatok gyakran tükrözik a kutató / fejlesztő (általában fiatal fehér férfiak) tudattalan elfogultságát.

Ahhoz, hogy megközelítsük Samantha önmegfigyelési és érvelési képességét, be kell állítanunk valamiféle mesterséges érzelmi intelligenciát robotjainkba: hogy képesek legyenek válaszolni

- miért döntött úgy, hogy ezt csinálja?

És még a mai viszonylag egyszerű rendszerek is lépéseket tesznek a kérdésekre adott individualista válaszok szintetizálása felé.

Időközben annak biztosítása, hogy a gépi tanulási algoritmusainkat jó minőségű adatokra alkalmazzuk egy szorosan megfigyelt környezetben, a legközelebb érinti az érzelmileg intelligens gépekhez.

A szemantikus web

A világháló web alkotója, Tim Berners-Lee jóval megelőzte azokat az időket, amikor 2001-ben javasolta a szemantikus webet:

„Egy olyan rendszer, amely lehetővé teszi a számítógépek számára, hogy a web erőforrásai közötti kapcsolatokból következtetéseket vonjanak le”.

Alapvetően a gépek dokumentumok és oldalak helyett össze tudnak kapcsolni ötleteket, fogalmakat és tényeket.

Ez lehetővé tenné, hogy Samantha-szerű „számítógépes asszisztensek” „olvassanak” rólunk információkat és működjenek a nevünkben: önállóan ütemezzék a megbeszéléseket, megszervezzék az utazásainkat, vacsorát foglalnak. Üdvözlet, álmaink PA.

Berners-Lee elképzelését bizonyos mértékig már megvalósította a Google Tudásgráfja, amely megkövetelte a Google-tól, hogy több ezer embert béreljen fel arra, hogy kifejezett szabályokat adjon be a józan ész tudásának szimbolikus ábrázolásához.

Ez lehetővé teszi a Google számára, hogy a kérdésekre egy weboldal felsorolása helyett egy kis strukturált adatokkal (lent) válaszoljon.

A képfelismerő technológiák a szemantikai web előfutára is lehetnek; ez az AI már képes felismerni a képek kulcsszavait, demográfiai adatait, színét és arcát.

Természetes beszédfelismerés

A természetes nyelv megértésének képessége kulcsfontosságú a sikeres robot számára; szöveggel, de hangfelismeréssel is.

Ideális esetben egy botnak képesnek kell lennie arra, hogy elérje a célját azáltal, hogy automatikusan kitölti a társalgási takarókat.

Siri, Cortana és Alexa még nem teljesen felelnek meg Samantha szabványainak. De ezen a téren végzett előadása nem tűnik elérhetőnek.

A beszédfelismerési hibaarány évente körülbelül 20% -kal esik, a Google közelmúltban mindössze 4,1% -át érte el - szinte ugyanolyan pontos, mint az embereké.

Ezek a fejlesztések számos újításnak tulajdoníthatók: többmikrofon tömbök, irányított sugarak, kifinomult zajfeldolgozás és a hangbiometria alkalmazása.

A hallás jelenet elemzése egy másik ígéretes módszer, amely megpróbálja különböztetni a különféle hangforrásokat.

A hangfelismerés előnyeit az is egyre hatalmasabb adatgyűjtés képezi, amelyet statisztikai modellek gépi tanulási technikákkal történő képzésére használnak: ezek egyikét Deep Neural Networks (DNN) néven hívják.

A DNN-k több összekapcsolt rétegből állnak a feldolgozó egységekből, amelyeket az emberi agy ideghálójai ihlette.

Különféle bemeneteket - képeket, szavak sorozatait, helyét és a beszédhangokat - osztályozhatják a kívánt kategóriákba, például szavak, tárgyak és jelentések ábrázolására.

Háttér és absztrakció

Az az érvelés, amelyet emberekként teszünk, a kontextus megértésén és következtetések levonásán alapul. Ezek néha logikusak, de többnyire a világ közös ismeretein alapulnak: felismerve, hogy X valószínűleg Y-hoz vezet.

Az AI-hez történő alkalmazás esetén az ideális virtuális asszisztensnek képesnek kell lennie alternatívákat javasolni, amikor korlátozással szembesül, mérlegelni kell a különböző lehetőségeket és meg kell értenie azok érdemeit:

Én: "Szeretnék ma cipőt vásárolni a Melissa-ban"
Bot: „Sajnálom, Melissa bezárt. Miért nem próbálja ki az Office-t, amely hasonló és közel van? "

Egy bot elvileg megtanulhatja ezeket az asszociációkat próba és hiba útján, de ez korosztályt vehet igénybe: minden interakciónak millió különféle változata van.

Néhány AI kutató szerint ez a kulcs a számítógépek számára az analógia útján történő tanuláshoz. Ez a képesség teszi lehetővé az embereknek, hogy általánosítsák az egyik helyzetet a másikba, elválaszthassák a kontextustól a magasabb szintű megértéshez

Emberi hangzású robotok

Az érzelmi tartomány és a behatás Samantha hangjában még mindig nem áll rendelkezésre, de az olyan új beszédgenerációs modellek, mint a Google WaveNet képesek „ijesztően meggyőző” mesterséges hangokat előállítani.

Nincs több robot Siri.

A természetes hangzású hang nagymértékben növeli a gép intelligenciájának benyomását. Ennek hátránya, hogy a felhasználó nevében felveti az elvárásokat, potenciálisan társalgási kudarcokhoz és frusztrációhoz vezetve.

És mindannyian tudjuk, hogy sokkal kevesebb türelem van egy gépen, mint egy embernél ...

Függetlenül attól, hogy egy bot megfelel-e az elvárásainknak, hajlamosak vagyunk arra, hogy az emberekhez hasonló viselkedést mutató gépekbe (szójáték, büntetés, viccek, idézetek és érzelmi következtetések) gépeinkbe vegyük a hitünket.

Ez felidézte a Turing-tesztet, ahol az emberi bíró beszélgetést folytat egy másik emberrel és egy gépen. Ha a bíró nem tudja megmondani a gépet az embertől, akkor a gép letette a tesztet.

Insights

Segíthetnék-ea AI betekintésünk fejlesztésében?

A betekintés lényege, ad valamit, ami új és értékes is. A legfontosabb azonban, hogy segítséget nyújt a jövőbeli döntések és tevékenységek irányításához - ez valami trükkös a szoftver megértéséhez.

Tudunk egy betekintést, amikor látjuk, de nehéz körülhatárolni vagy éles határokat húzni körülötte. És ahhoz, hogy betekintést tudjunk fejleszteni, a minták, kapcsolatok, összefüggések azonosítását kell elvégezni.

Néhány gépi tanulási projekt már bejutott erre a területre.

Például a Google Deep Mind (amely szintén DNN-ket használ) jól azonosítja az új mintákat, olyan összetettségi szinten, amely egy esetben (a játék Go) meghaladja az emberekét. De az ilyen technikák csak akkor működnek, ha elmondjuk a gépnek, hogy mi a cél (ebben az esetben a játék megnyerése).

Csak az emberek képesek azonosítani az új mintákat, amelyek előre meghatározott cél nélkül érdekesek. A gép képes azonosítani a mintákat, ha érti a célt; csak az emberek képesek kreatívan azonosítani a mintákat.

Másrészt az egyik olyan probléma, amellyel az emberek szembesülnek, hogy amikor egy adott feladatra összpontosítunk, sok információra támaszkodunk. Ezen információk egy részét öntudatlanul, tapasztalatok révén szerezték meg; részben szándékos tanulással.

De amint az információ mennyisége növekszik, az a mennyiség, amelyen át tudjuk szitálni, arányosan egyre kevesebbé válik.

Tehát itt van a gépek előnye; jobban kezelik a hatalmas adatkészleteket.

Amikor ezeket az adatokat összegyűjtjük és integráljuk, a gépek együttműködhetnek velünk azokon a területeken, ahol küzdenek.

És jelenleg a legtöbb digitális információ szöveges formában van - vagyis az adatok nem strukturáltak, nem pedig a hagyományos adatbázisokban található strukturált adatok.

Szöveges adatok

Ez elvisz minket a gépolvasás területére, amely az elmúlt 20 páratlan évben elhagyta a kutatólaboratóriumokat és a kereskedelmi alkalmazásokat.

Bár az írott szövegek megértésének automatizált technikái még messze sem tökéletesek, a közelmúltban gyorsan érlelődtek, amelyeket az AI új fejleményei támogattak.

Íme egy példa.

Egy beteg egy olyan ritka betegséggel jár be az orvos irodájába, amelyet az orvos még nem ismeri. Az orvos konzultál a digitális asszisztensével, amely másodpercek alatt beolvassa az összes orvosi naplót, tényt és információt, amelyet valaha írt a betegségről.

Ezután összefoglalja ezt az információt, és harapós darabokban bemutatja az orvosnak.

A Maluuba, a Microsoft által a közelmúltban megszerzett mélyreható tanulási vállalkozás, olyan „írástudó gépet” próbál kifejleszteni, amely képes olvasni a szöveget és megtanulni kommunikálni ezen az alapon.

Alapvetõen a számítógépek hatalmas mennyiségû szöveget tudnak felmérni, összegyûjteni és összefoglalni olyan módon, amellyel soha nem tudhatnánk álmodni.

És nem kell nagyon technikai számítógépes programozási nyelveket vagy adatbázis-lekérdezéseket használni ahhoz, hogy elmondjuk, amit keresünk: a nemrégiben kifejlesztett rendszerek a természetes nyelveket is használhatják a szöveggel kapcsolatos kérdések feltevésére.

Ez a valami, amelyet már bizonyos mértékben megismerünk, köszönhetően a Google-kedvelőknek történő gépelésnek (az automatikus kitöltés ezt még könnyebbé teszi).

Mindez a botokat e hagyomány természetes örököseivé teszi.

Az utolsó államcsíny az, hogy most már személyre szabjuk azokat az alkalmazásokat, amelyek interakció révén tanulnak.

A Replika például a múltbeli csevegésen keresztül történő szkennelés alapján sajátos nyelvmintákat fejleszti ki, megismerve a felhasználó preferenciáit és prioritásait.

És ez nagyon közel vezet Samantha területéhez.

AI-alapú emberi intelligencia

Az első ipari forradalom alatt a gépek elkezdték átvenni a kézi munkát.

Ma az Ipar 4.0-val a kézi mentális munkát is átveszik.

Szinte minden rutin alapú feladat automatizálható.

És mint értékesítők és marketingszakemberek, rengeteg olyan mindennapi feladat van, amelyekre nem gondolnánk, hogy megkönnyebbítsük magunkat, például:

… Adatbevitel kézi bevitele, témák és ötletcikkek keresése, végtelen e-mailek átvágása…

Ha ezeket továbbadjuk egy mesterségesen intelligens „elmének”, képesek vagyunk arra, hogy erőfeszítéseinket olyan területekre összpontosítsuk, amelyekben mi (mint emberek) kiemelkedünk, és amelyek megkülönböztetnek minket (mint ember) a gépektől.

Ez volt a kiindulópontunk a GrowthBot, az értékesítési és marketing bot fejlesztéséhez, amelyet arra terveztünk, hogy segítse vállalkozása növekedését.

Nem tudok új betekintést hozni; de ez segíthet abban, hogy kreativitásunkat hatékonyabban bekapcsoljuk a játékba.

Megvizsgálhatunk egy csomó adatot, kapcsolatot és összefüggéseket, és azt gondolhatjuk, hogy látunk valami újat, valamit, amely segít megérteni a világot.

Végül is az az, amiben az emberek jók.

De vajon ez a betekintés puszta megtévesztés, vagy ennél több? Itt utasíthatjuk az automatizálást a belépésre, a feltételezések kiküszöbölésére és az átláthatóság létrehozására.

Ahogyan látjuk, az AI legígéretesebb aspektusa nem az a képesség, hogy egy élethű társat megismételjék, mint Samantha -, hanem a saját intelligenciánk erősítése, mint emberek.

Köszönöm, hogy elolvasta.

Ha tetszett ez a cikk, nyugodtan nyomja meg azt a taps gombot, hogy mások megtalálják.

.

Eredetileg a blog.growthbot.org oldalon tették közzé.