A Samantha-effektus: közelebbről a robotok jövőjére

2013-ban a Spike Jonze kiadta az indie-sci-fi-dráma-romcom "Her" című kiadványát.

A film követi a világ első mesterségesen intelligens operációs rendszerének, a Samanthanak az evolúciós pályáját.

Scarlett Johansson félrevonja, hogy Samantha minden fejlesztő álmodozása: a „valódi” mesterséges intelligencia (AI) tökéletes példája. Lenyűgöző beszélgető, felfogja a kontextust, a természetes nyelvet, az érzelmeket és a józan észt.

Nyilvánvaló, hogy a modern botok nem egészen Samantha szintjén vannak. A legjobb esetben képesek konkrét eredményeket kínálni egy társalgási felületen keresztül. A legrosszabb esetben ők - a telefonod a falhoz képest - frusztráltak.

Mivel a technológia villámsebességgel fejlődik, elmozdulhatnánk-e egy olyan korszak felé, ahol létezhet egy Samantha-szerű bot?

Érzelmileg intelligens adatok

A mai AI ötvözi a szimbolikus feldolgozást (AI egyértelmű szabályokat és logikát használva) a gépi tanulással oly módon, hogy kihasználja az erősségeiket és csökkentse gyengeségeiket.

Például a szimbolikus feldolgozás lehetővé teszi azon tudás és viselkedés meghatározását, amelyeket nehéz lehet megtanulni az adatokból. A gépi tanulás kiegészíti ezt azzal, hogy segíti a rendszert a váratlan helyzetekhez és az új koncepciókhoz való alkalmazkodásban.

Ez a kombináció a tanulási folyamat felgyorsításán túl hasznos tulajdonságokkal is rendelkezik. A jövőben lehetőséget adhatna nekünk arra, hogy az emberekkel való emberi interakcióban a robotokkal kapcsolatba lépjünk.

Mivel a gépi tanulás minden vonzó tulajdonsága ellenére alapvetően statisztikai folyamat. Ez azt jelenti, hogy tükrözi az adatok minőségét, amelytől függ.

Ez áldás és átok. A gépi tanulás érzékenysége a bemeneti adatok jellemzőire azt jelenti, hogy könnyen megtanulhatja a rossz dolgokat, amint azt Tay, a Microsoft rasszista robotja esetében is kimutatták.

Azt is vitatják, hogy a gépi tanuláshoz kiválasztott adatok gyakran tükrözik a kutató / fejlesztő (általában fiatal fehér férfiak) tudattalan elfogultságát.

Ahhoz, hogy megközelítsük Samantha önmegfigyelési és érvelési képességét, be kell programoznunk valamilyen mesterséges érzelmi intelligenciát robotjainkba: hogy képesek legyenek válaszolni

- miért döntött úgy, hogy ezt csinálja?

És még a mai viszonylag egyszerű rendszerek is lépéseket tesznek a kérdésekre adott individualista válaszok szintetizálása felé.

Időközben annak biztosítása, hogy a gépi tanulási algoritmusainkat jó minőségű adatokra alkalmazzuk egy szorosan megfigyelt környezetben, a legmegfelelőbb érzelmileg intelligens gépekhez fogunk jutni.

A szemantikus web

A világháló web alkotója, Tim Berners-Lee jóval megelőzte azokat az időket, amikor 2001-ben javasolta a szemantikus webet:

"egy olyan rendszer, amely lehetővé teszi a számítógépek számára, hogy a web erőforrásai közötti kapcsolatokból következtetéseket vonjanak le".

Alapvetõen a gépek dokumentumok és oldalak helyett össze tudnak kapcsolni ötleteket, fogalmakat és tényeket.

Ez lehetővé tenné, hogy Samantha-szerű „számítógépes asszisztensek” „olvassanak” rólunk információkat és működjenek a nevünkben: önállóan ütemezzék a találkozóinkat, megszervezzék az utazásainkat, vacsorát foglalnak. Üdvözlet, álmaink PA.

Berners-Lee elképzelését bizonyos mértékig már megvalósította a Google Tudás gráfja, amely megkövetelte a Google-tól, hogy embereket ezreket béreljen fel, hogy kifejezett szabályokat adjanak be a józan ész tudásának szimbolikus ábrázolásához.

Ez lehetővé teszi a Google számára, hogy a kérdésekre egy weboldal felsorolása helyett egy kis strukturált adatokkal (lent) válaszoljon.

A képfelismerő technológiák a szemantikai web előfutára is lehetnek; ez az AI már képes felismerni a képek kulcsszavait, demográfiai adatait, színét és arcát.

Természetes beszédfelismerés

A természetes nyelv megértésének képessége kulcsfontosságú a sikeres robot számára; szöveggel, de hangfelismeréssel is.

Ideális esetben egy botnak képesnek kell lennie arra, hogy elérje a célját azáltal, hogy automatikusan kitölti a társalgási takarókat.

Siri, Cortana és Alexa még nem igazán felelnek meg Samantha szabványainak. De ezen a téren végzett előadása nem tűnik elérhetetlennek.

A beszédfelismerési hibaarány évente körülbelül 20% -ra esik, a Google által a közelmúltban mindössze 4,1% -ra - szinte ugyanolyan pontos, mint az emberekre.

Ezek a fejlesztések számos újításnak tulajdoníthatók: többmikrofon tömbök, irányított sugarak, kifinomult zajfeldolgozás és a hangbiometria alkalmazása.

A hallás jelenet elemzése egy másik ígéretes módszer, amely megpróbálja különböztetni a különféle hangforrásokat.

A hangfelismerés előnyeit az is egyre hatalmasabb adatkészlet használja, amelyet statisztikai modellek gépi tanulási technikákkal történő képzésére használnak: ezek egyikét Deep Neural Networks (DNN) néven hívják.

A DNN-k több, egymással összekapcsolt feldolgozóegység-rétegből állnak, amelyeket az emberi agy ideghálói inspiráltak.

Különféle bemeneteket - képeket, szavak sorozatait, helyét és a beszédhangokat - osztályozhatják a kívánt kategóriákba, például szavak, tárgyak és jelentésmegjelenítés.

Háttér és absztrakció

Az az érvelés, amelyet emberekként teszünk, a kontextus megértésén és következtetések levonásán alapul. Ezek néha logikusak, de többnyire a világ közös ismeretein alapulnak: felismerve, hogy X valószínűleg Y-hoz vezet.

Az AI-hez történő alkalmazás esetén az ideális virtuális asszisztensnek képesnek kell lennie alternatívákat javasolni, amikor korlátozással szembesül, mérlegelni kell a különböző lehetőségeket és meg kell értenie azok érdemeit:

Én: "Szeretnék ma cipőt vásárolni a Melissa-nál"
Bot: „Sajnálom, Melissa bezárt. Miért nem próbálja ki az Office-t, amely hasonló és közel van? "

A botok elvileg megtanulhatják ezeket az asszociációkat próba és hiba útján, de ez korosztályt vehet igénybe: minden interakciónak millió különféle változata van.

Néhány AI kutató szerint ez a kulcs a számítógépek számára az analógia alapján történő tanuláshoz. Ez a képesség teszi lehetővé az embereknek, hogy általánosítsák az egyik helyzetet a másikba, elválaszthassák a kontextust a magasabb szintű megértéshez

Emberi hangzású robotok

Az érzelmi tartomány és a behatás Samantha hangjában még mindig nem áll rendelkezésre, de az olyan új beszédgenerációs modellek, mint a Google WaveNet képesek „félelmetesen meggyőző” mesterséges hangokat előállítani.

Nincs több robot Siri.

A természetes hangzású hang nagymértékben növeli benyomását a gép intelligenciájáról. Ennek hátránya, hogy felveti a felhasználó elvárásait, potenciálisan társalgási kudarcokhoz és frusztrációhoz vezetve.

És mindannyian tudjuk, hogy sokkal kevesebb türelem van egy gépen, mint egy embernél ...

Függetlenül attól, hogy egy bot megfelel-e az elvárásainknak, hajlamosak vagyunk arra, hogy az emberekhez hasonló viselkedést mutató gépekbe (szójáték, büntetés, vicc, idézettség és érzelmi következtetés) gépeinkbe vegyük a hitünket.

Ez felidézte a Turing-tesztet, ahol az emberi bíró beszélgetést folytat egy másik emberrel és egy gépen. Ha a bíró nem tudja megmondani a gépet az embertől, akkor a gép letette a tesztet.

Insights

Segíthet-e az AI nekünk a „betekintés” fejlesztésében?

A betekintés lényege, ad valamit, ami új és értékes is. A legfontosabb azonban, hogy segítséget nyújt a jövőbeli döntések és tevékenységek irányításához - ez valami trükkös a szoftver megértéséhez.

Tudunk egy betekintést, amikor látjuk, de nehéz meghatározni vagy éles határokat húzni körülötte. És ahhoz, hogy betekintést tudjunk fejleszteni, a minták, kapcsolatok, összefüggések azonosítását kell elvégezni.

Néhány gépi tanulási projekt már bejutott erre a területre.

Például a Google Deep Mind (amely szintén DNN-ket használ) jó az új minták azonosításához, olyan összetettségi szinten, amely egy esetben (a Go játék) meghaladja az emberekét. De az ilyen technikák csak akkor működnek, ha elmondjuk a gépnek, hogy mi a cél (ebben az esetben a játék megnyerése).

Csak az emberek képesek azonosítani az új mintákat, amelyek előre meghatározott cél nélkül érdekesek. A gép képes azonosítani a mintákat, ha érti a célt; csak az emberek képesek kreatívan azonosítani a mintákat.

Másrészt az egyik olyan probléma, amellyel az emberek szembesülnek, hogy amikor egy adott feladatra összpontosítunk, sok információra támaszkodunk. Ezen információk egy részét öntudatlanul, tapasztalatok révén szerezték meg; részben szándékos tanulással.

De amint az információ mennyisége növekszik, az a mennyiség, amelyen át tudjuk szitálni, arányosan egyre kevesebbé válik.

Tehát itt van a gépek előnye; jobban tudnak kezelni a hatalmas adatkészleteket.

Amikor összeállítjuk és integráljuk ezeket az adatokat, a gépek együttműködhetnek velünk azokon a területeken, ahol küzdenek.

És jelenleg a legtöbb digitális információ szöveges formában van - vagyis az adatok nem strukturáltak, nem pedig a hagyományos adatbázisokban található strukturált adatok.

Szöveges adatok

Ez a gépi olvasás területére vezet, amely az elmúlt 20 páratlan évben elhagyta a kutatólaboratóriumokat és a kereskedelmi alkalmazásokat.

Bár az írott szövegek megértésének automatizált technikái még messze sem tökéletesek, a közelmúltban gyorsan érlelődtek, amelyeket az AI új fejleményei támogattak.

Íme egy példa.

A beteg olyan ritka betegséggel jár be az orvos irodájába, amelyet az orvos nem ismeri. Az orvos konzultál a digitális asszisztensével, amely másodpercek alatt beolvassa az összes orvosi naplót, tényt és információt, amelyet valaha írt a betegségről.

Ezután összefoglalja ezt az információt, és harapós darabokban bemutatja az orvosnak.

A Maluuba, a Microsoft által a közelmúltban megszerzett mélyreható tanulási vállalkozás, olyan „írástudó gépet” próbál kifejleszteni, amely képes olvasni a szöveget és megtanulni kommunikálni ezen az alapon.

Alapvetõen a számítógépek hatalmas mennyiségû szöveget tudnak felmérni, összegyûjteni és összefoglalni olyan módon, ahogyan soha nem tudhatnánk.

És nem kell kifejezetten technikai számítógépes programozási nyelveket vagy adatbázis-lekérdezéseket használni ahhoz, hogy elmondjuk, amit keresünk: a nemrégiben kifejlesztett rendszerek a természetes nyelveket is használhatják a szöveggel kapcsolatos kérdések feltevésére.

Ez a valami, amelyet már bizonyos mértékben megismerünk, köszönhetően a lekérdezéseknek a Google kedvelőinek történő beírásához (az automatikus kitöltés ezt még könnyebbé teszi).

Mindez a botokat e hagyomány természetes örököseivé teszi.

Az utolsó államcsíny az, hogy most már személyre szabjuk azokat az alkalmazásokat, amelyek interakció révén tanulnak.

A Replika például a múltbeli csevegésen keresztül történő szkennelésen alapuló sajátos nyelvmintákat fejleszti ki, megismerve a felhasználó preferenciáit és prioritásait.

És ez nagyon közel hoz minket Samantha területéhez.

AI-alapú emberi intelligencia

Az első ipari forradalom alatt a gépek elkezdték átvenni a kézi munkát.

Ma az Industry 4.0-val a kézi mentális munkát is átveszik.

Szinte minden rutin alapú feladat automatizálható.

És mint értékesítők és marketingszakemberek, rengeteg olyan hétköznapi feladat van, amelyekre nem gondolnánk, hogy megkönnyebbítsük magunkat, például:

… Adatbevitel kézi bevitele, témák és ötletcikkek keresése, végtelen e-mailek átvágása…

Azáltal, hogy ezeket továbbadjuk egy mesterségesen intelligens 'elmenek', képesek vagyunk arra, hogy erőfeszítéseinket olyan területekre összpontosítsuk, amelyekben (mint emberek) kiemelkedünk, és amelyek megkülönböztetnek minket (mint ember) a gépektől.

Ez volt a kiindulópontunk a GrowthBot, az értékesítési és marketing bot fejlesztéséhez, amelyet arra terveztünk, hogy segítse vállalkozása növekedését.

Nem tudok új betekintést hozni; de ez segíthet abban, hogy kreativitásunkat hatékonyabban játsszuk a játékban.

Megvizsgálhatunk egy csomó adatot, kapcsolatot és összefüggéseket, és azt gondolhatjuk, hogy látunk valami újat, valamit, amely segít megérteni a világot.

Végül is az az, amiben az emberek jók.

De vajon ez a betekintés puszta megtévesztés, vagy ennél több? Itt utasíthatjuk az automatizálást a belépésre, a feltételezések kiküszöbölésére és az átláthatóság létrehozására.

Ahogyan látjuk, az AI legígéretesebb aspektusa nem az a képesség, hogy egy élethű társat megismételjék, mint Samantha -, hanem a saját intelligenciánk erősítése, mint emberek.

Köszönöm, hogy elolvasta.

Ha tetszett ez a cikk, nyugodtan nyomja meg azt a taps gombot, hogy mások megtalálják.

.

Eredetileg a blog.growthbot.org oldalon tették közzé.