Applikációk a mesterséges intelligencia árnyékában

IT
it

2018. február 6.

Szerző:
B. Szabó Edina

Applikációk a mesterséges intelligencia árnyékában

A tetris, a pulzusmérő, a kilométer-számláló és a havi kiadástervező applikációkat – hamarosan – leváltják a mesterséges intelligencia (MI) és a kiterjesztett valóság iránt felmerülő felhasználói igényeket kielégíteni szándékozó applikációk. De ezeket nevezhetjük-e még applikációknak? Biztosan jó lesz nekünk, ha mindenben követjük a trendeket? Tudatában vagyunk annak, hogy milyen „ingyenes” szolgáltatásokért cserébe átadott információkra épül ezek fejlesztése?

Kérdéseinkkel Barczi Bálint fejlesztő szakértőhöz fordultunk, aki számos applikáció elkészítésén van már túl, és jól látja, merre tartunk. Nem mindenre van megnyugtató válasz, vagy inkább nem megnyugtatóak a válaszok, de mindenképpen izgalmas korszak előtt állunk – az applikációkat illetően is.

Először is tisztázzuk, mit értünk az alkalmazás kifejezésen?

– Nagyon egyszerűen fogalmazva: az alkalmazás egy olyan program, amely a felhasználót bármilyen művelet elvégzésében segíti, vagy hozzáférést biztosít bármilyen új felülethez.

Mi történik azokkal az alkalmazásokkal, amelyekre a felhasználók három hét után ráunnak, vagy egyszerűen visszaszorulnak az újabb appok miatt? Van törlési vagy elévülési protokoll az áruházakban?

– Az évekig elhanyagolt alkalmazások általában fennmaradnak ezekben a store-okban, legfeljebb előbb-utóbb „kipontozódnak”, nem lesz rájuk igény. Még mindig találni a Google Play vagy az App Store áruházában olyan appokat, melyeket már legalább öt éve nem frissítettek. Ezeket, ha nagyon akarjuk, le lehet még tölteni, de valószínűleg nem fognak működni a fiatalabb eszközeinken.

Bár úgy tűnik, hogy a felhasználókat egyre rövidebb időre lehet elkápráztatni, ezer és ezer applikáció lát napvilágot, ingyenesen vagy több-kevesebb pénzért. Várhatóan melyik terület válik vonzóvá, mi az, amire érdemes több figyelmet fordítanunk?

– Jóval nagyobb hangsúlyt kapott a már az utóbbi két-három évben is gyorsan fejlődő mesterséges intelligencia, a különböző chatbotok és a hangirányítású virtuális asszisztensek. Az Amazon és a Google már piacra dobott ilyen virtuális asszisztenst, amelynek segítségével – a megfelelő eszközzel hálózatba kötve – hangalapú parancsokkal például zenét válthatunk, vagy ételt rendelhetünk az okos hűtőnkbe, és az Apple is hamarosan belép a területre az idén megjelenő HomePod nevű termékével.

A Google eszköze egyébként elég érdekes kérdéseket vetett fel, természetesen csak miután a felhasználók többször is átgondolták, hogyan is működik… Elegendő volt a nappaliba letenni, és aztán a többit az eszköz intézte. Szinkronizált, figyelt és tanult – és a nap 24 órájában képeket készített a lakásban, házban zajló eseményekről abban a pillanatban, amikor azt a mesterséges intelligencia és a képfelismerés úgy ítélte meg, hogy érdemes. Vagyis tulajdonképpen nonstop aktívan figyelt, és megörökítette a számára értékesnek tűnő pillanatokat.

Véleményem szerint az egyik legfontosabb kérdés a felhasználók tájékoztatása, és annak tudatosítása, hogy milyen veszélyeket rejt a fejlesztések feltételek és kérdések nélkül történő használata a mindennapi életben. Hiszen amikor maguk a fejlesztők, tudósok, jövőszakértők elképzeléseit is felülmúlja az MI fejlődése, akkor érdemes kicsit komolyabban venni a kommunikációt is. Jó példa erre a „tervezési lemaradásra” a Google MI fejlesztőrészlegén működő deep learning (azaz mélytanulás) nevezetű rendszer, amely saját magát képezi-tanítja sajátos algoritmusok és modellek alapján. Önmagát okosítja. A kutatók a megalkotásakor úgy kalkuláltak: ahhoz, hogy a mesterséges intelligencia megverje a legprofibb játékost a világ egyik legbonyolultabb elmejátékában, még legalább 15-20 évnek kell eltelnie. Na, ez az elmélet tavaly megdőlt, mert az MI megverte a legjobb játékost – és most már annyira fejlett a rendszer, hogy egyszerre tud a top 50 játékossal játszani, és mindegyiket legyőzi. Ez nehezen felfogható, mint ahogy az is, hogy egy MI képes arra, hogy a „megszületése” után három órán belül járóképessé tegyen egy robotot, vagyis megtegye azokat az alapvető mozgásokat, amelyekre az ember nem képes.

A 24 órás megfigyelés vagy az adataink kereskedelmi formában történő felhasználása azért felvet néhány biztonságtechnikai kérdést.

– A titkosítás évek óta kiemelt terület, tavaly számos konferencia és szakmai rendezvény fókuszált kifejezetten az információbiztonságra, az adatvédelemre, fontos téma volt a titkosítás, elsősorban a személyre szabott megoldások kapcsán, illetve mert például a mesterséges intelligenciához a közszféra szervezeteinek nincs hozzáférésük, így nem tudnak belepiszkálni, adatot kivenni a rendszerből. Viszont ezzel párhuzamosan a nagy cégek igen, és nem is félnek felhasználni, mert még mindig nem vesszük elég komolyan az adatvédelmet, hiányzik a számonkérés erős formája. Kicsit sarkítva: felhasználunk bármit, ami ingyenes, az apró betűs részek felett elsiklunk – még az angol nyelvű felhasználók is, hiába anyanyelviek –, és a cégek sem igazán transzparensek. Azzal tisztában vagyunk, hogy a tőlünk érkező információfeldolgozásnak köszönhetően a Facebook erősen személyre szabott ajánlatokkal szórakoztat, a Google pedig még inkább – attól függően, hogy mit nézünk meg, és mire keresünk rá. Érdekes módon ez elfogadható számunkra a virtuális térben, de gondoljunk bele, mi történne, ha miután kijönnénk egy cipőboltból, három utcával arrébb valaki odajönne és közölné, hogy ugyanez a márka, amit megnéztünk vagy megvettünk, két utcával arrébb 20 százalékkal olcsóbban kapható. Honnan tudja, hol voltunk? Hogy mit vettünk? Hogy mit keresünk egyáltalán?! Ugye mennyivel mást jelent a dolog? Pedig ugyanarról a „betekintésről” van szó a privát szféránkba. A cégek kommunikációja pedig jól működik, hiszen mindez a mi kényelmünket szolgálja. Bizakodjunk, hogy a Google asszisztense valóban nem küldte máshova, vagy nem tárolja más célra a rögzített adatokat. Illetve abban, hogy elég erős a védelmi rendszer ahhoz, hogy legalább nehéz legyen feltörni és adatot lopni tőle.

A kis betűs részre visszatérve, a nagy cégek mindig elmondják nekünk, mit kérnek cserébe egy-egy ingyenes szolgáltatásukért. Ezek általában adatok, még nem érzékeny, de személyes, illetve üzletileg hasznosítható adatok. Ez alapvetően nem probléma, egy felnőtt felhasználó önállóan dönthet minden szolgáltatás igénybevétele előtt. Sőt, néhol menet közben is kell követni a frissítéseket, és ezt egyes szolgáltatók jelzik is, mint például a Facebook. Időről időre érkezik egy központi üzenet, amelyben ellenőrzésre vagy új beállítási lehetőségekre hívják fel a figyelmünket. Kis összehasonlítás a Google és az Apple között: mindkét vállalat fejlesztett képfelismerő rendszert, amelynek, ha elküldünk egy képet, felismeri annak tárgyát, több ezer kategória közül válogatva. Hogy mi a különbség?

Ahogy az Apple az iPhone-t, úgy a Google is kihozta a Pixelt, amely házon belül készült, és gyári, stock Android van rajta, semmi más. Ezt az eszközt azzal reklámozzák, hogy bármennyi fotót készíthet a tulajdonosa 2020-ig, azok a fotók felkerülnek a saját albumába, és ott ingyenesen tárolják neki. De közben a lényeg az, hogy a feltöltött képeket ők korlát nélkül felhasználják, és a saját berkeiken belül annak segítségével fejlesztik a mesterséges intelligencia eszközeiket.

Az Apple ezzel szemben alkalmaz egy differenciális titkosítást, amely egy matematikailag biztosított titkosítási rendszer. A lényege, hogy amikor ők anonim adatot kérnek le a készülékről, az eszköz „hazudik”, például a képet azonosító számsor egyik száma nem 1, hanem 8 lesz. Viszont olyan mennyiségű adatot kérnek le, hogy ezek a kis eltérések fel sem tűnnek az adatfolyamban, viszont a végeredmény releváns lesz úgy, hogy nem visszakövethető a készülékhez. Vagyis az Apple nem célzottan a felhasználók képeit veszi alapul, hanem az internetről vesz le képeket a képfelismerő tanítására, a beazonosításhoz. Ez a titkosítás szempontjából pedig nagyon fontos, és elősegíti, hogy egyre jobban bízzunk a technikában.

A Twitter esetében éppen nemrégiben tört ki egy kisebb botrány, amely szerint több száz alkalmazott monitorozza az emberek direct message/privát üzeneteit, amelyek elvileg magánüzenetek, a cég pedig ugyanezt teszi a képekkel – amelyek az esetek túlnyomó többségében bizony intim képek. Ráadásul az is érdekes, hogy már akkor, amikor először bejelentkezünk az oldalra, azonnal rengeteg információval rendelkezik a weboldal rólunk anélkül, hogy bármilyen külön tevékenységet végeztünk volna ott azelőtt…

Azért csak lesz pozitív eredménye is már 2018-ban a mesterséges intelligencia fejlődésének?

– Természetesen, sőt, mindenki mintha csak azt látná, mintha csak arra fókuszálna, miközben a várható negatívumokra azért fel kellene készülni – egyáltalán meg kellene fogalmazni, hogy milyen negatívum lehet ebben a fantasztikus fejlődésben…
Ami biztosan sláger marad, az a kiterjesztett és a virtuális valósággal (röviden: AR és VR) kapcsolatos alkalmazások területe. Mivel a virtuális valóságnak vannak kezdeti „betegségei” – még sok ember rosszul lesz például a VR szemüvegtől –, valószínűleg erősebb lesz a kiterjesztett valóság megjelenése. Míg a VR szemüvegek viselése hasonló gondokat okozhat az agyban, mint amikor az űrhajósok fölmennek az űrbe, és az agyuk nem képes feldolgozni, amit lát, addig a kiterjesztett valóságban nagyon sok potenciál van.

Mi a kettő között a különbség?

– A kiterjesztett valóság esetében az eszköz kamerája, vagyis mondjuk a telefon helyez el képeket a valóságban, míg a VR esetében egy teljesen elképzelt és mesterséges helyszínen belül történnek a felhasználóval a dolgok. Utóbbi esetben úgy kell elképzelni a dolgot, mintha egy játékba lépnénk be, a kiterjesztett esetében viszont sokkal többet tudunk kihozni a valós környezetből. Ilyen volt például a Pokémon Go játék, amikor valós környezetben helyeztek el megtalálnivalókat a fejlesztők, a játékosok pedig a telefont az adott környezetponthoz emelve „látták” az ott lévő „vadásznivalót”. Ehhez csak a – mindig magunknál hordott – telefonunkra és az applikáció letöltésére volt szükség.

Volt már szerencsém AR alapú alkalmazást készíteni, a megrendelő egy bizonyos érzékhatás elérését kérte, amihez nagyon sok különleges szűrőt, filtert alkalmaztunk, miközben egy kicsit keveredtek a VR és az AR megoldások. A telefont a VR szemüvegen keresztül kellett nézni ugyanis, hogy elérjük a kellő hatást. Ez például egy olyan kommunikációs megoldás lett, amelynek célja tulajdonképpen egyfajta empátiafejlesztés az azt kipróbálókban. (Egy ilyen típusú termék képes úgy hatni a különböző érzékszerveinkre, hogy átérezzük például egy betegség tüneteinek érzékekre gyakorolt hatását, mint szédülés, kettős látás – a szerk.) Elérték, hogy úgy érezzék magukat az eszközökkel, mint ahogy egyes emberek nap mint nap éreznek. Ez nagyon komoly dolog, és úgy vélem, ilyen megoldásokból egyre több készül már a közeli jövőben is.
Ez is egy trend, de ezeket a trendeket minél előbb „meg kell lovagolni”, nem csupán fejlesztői, de megrendelői oldalról is, mert nagyon nehéz kitűnni az alkalmazáspiacból. Ha egy app nem elég innovatív, ha nincs benne valami, amire más még nem gondolt, akkor csak egy lesz az ezerből, a már említett rövid idejű alkalmazások sorában.

Amerikában nem lehet olyan nehéz milliós felhasználói bázist találni, és sikeres vagy kvázi sikeres – rövid idejű, de nagy bevételt hozó – applikációt piacra vinni. Ez a milliós nagyságrend viszont, mondjuk, Magyarországon a teljes dolgozó felnőtt társadalmat lefedi… Mennyire álom amerikai piacra fejleszteni innen, Európa közepéről?

– A kulturális különbségek eleve annyira nagyok, hogy nehéz európai szemmel az amerikai piacra tervezni. Mert amit mi itt valós problémának gondolunk, az kint nem az, és ez persze fordítva is így van, tehát hazai pályára tartalmi szempontból könnyebb – viszont a magyarok nem járnak élen az alkalmazásvásárlás terén, tehát a kicsi piac még kisebb szelete érhető el. Az az igazság, hogy ugyanannyira álom és küzdelem amerikaiaknak fejleszteni, mint magyaroknak.

Akkor aligha lehet egységes trendről beszélni.

– Nem igazán, mert minden kultúrának mások az igényei. Igazság szerint nem lehet hasonló problémákat ugyanazzal az applikációval kielégíteni, kivéve talán, ha egy naptár vagy egy teendők jellegű alkalmazásról van szó, azt elvileg globálisan (majdnem) mindenki ugyanúgy tudja használni.

Ráadásul az aktuális irányvonalak is rendkívül gyorsan változnak, régen sokkal egyszerűbben kiszámítható volt például egy termékciklus, az, hogy mi az, aminek van létjogosultsága és sokáig fenn is marad. Ma inkább „járványszerűen” kitör valami, aztán néhány héten belül már el is tűnik. Annyi ingert kap a felhasználó, hogy nem tud egynél megmaradni, legalábbis nagyon nehéz erre késztetni.

A fejlesztéshez szükséges eszközök is ilyen ütemben fejlődnek?

– Mondhatjuk, igen, egyre több adathoz van hozzáférésünk, fejlődnek a szabványok is, például a Bluetooth esetében. Egyre trendibb például az arcfelismerés, az ujjlenyomat-felismerés továbbgondolása. Az az irány, amelyet az okostelefonok kijelzőinél tapasztalhatunk – minél keskenyebbek a szélek, annál szélesebb a felület –, a szenzorfejlesztési területhez kapcsolódó lehetőségeket dobja meg, az egészségügy területéről nem lehet eleget beszélni, jön például az Apple okosórájára fejlesztett vércukorszintmérő, amely „kiüti” a vágást, szúrást igénylő mérést, és így tovább.

Ha belegondolunk, hogy sok milliárd művelet fut le a háttérben, amíg lefotózunk valamit, már meg sem lepődünk azon, hogy 2020-ra önvezető autókat terveznek értékesíteni lakossági felhasználásra – merthogy addigra fogják az esetleges hibákat, nehézségeket kijavítani –, azon meg pláne nem, hogy, mondjuk, James Cameron a szemüveg nélküli 3D film technikai megoldását várja az Avatar című film következő részének bemutatásához – három éven belül. Ezek már majdnem mikro távú tervek, de úgy tűnik, minden eszköz adott lesz a megvalósításukhoz.•