AI teadmiste kaart: kuidas AI tehnoloogiaid klassifitseerida

Uue AI tehnoloogiamaastiku visand

Selle artikli lühem versioon ilmus esmakordselt Forbes

Artiklit on autasustatud ka KDnuggetsi hõbemärgiga kui ühte 2018. aasta augustis enim loetud ja jagatud artiklit.

I. Sissejuhatavad mõtted

Olen mõnda aega olnud tehisintellekti ruumis ja olen teadlik, et AI-le mõtlemiseks ja nende jälgimiseks on olemas mitu klassifikatsiooni, eristust, maastikku ja infograafikat. Kuid ma ei ole nende kategoriseerimisharjutuste suur fänn, peamiselt seetõttu, et kaldun arvama, et dünaamiliste andmepunktide klassifitseerimine etteantud parandusboksidesse pole sageli sellise “selge” raamistiku eeliseid väärt (see on üldistus muidugi, sest mõnikord on need äärmiselt kasulikud).

Kui rääkida konkreetselt tehisintellektist, siis arvan ka, et paljud seal olevad kategooriad on kas puudulikud või ei suuda tabada selle uue AI-laine tugevaid põhilisi seoseid ja aspekte.

Lubage mul kõigepealt öelda teile selle postituse põhjendus. Koostöös strateegilise innovatsiooniagentuuriga Chôra tahtsime luua inimestele visuaalse tööriista, et mõistaks selle tööriistakasti keerukust ja sügavust, ning koostada kaart, mis aitaks inimestel AI džunglis orienteeruda. Järgnevat graafikut tuleks vaadata struktureerimata teadmiste omamoodi ontoloogiaks jaotamise viisina, mille eesmärk on mitte kogu AI-s olemasoleva teabe täpne esitamine, vaid pigem tööriist selle infokogumi osa kirjeldamiseks ja sellele juurdepääsu saamiseks.

Järgnevalt on püütud joonistada arhitektuur, et pääseda juurde AI teadmistele ja tekkivale dünaamikale, värav olemasolevatele teadmistele sellel teemal, mis võimaldab teil uurida lisateavet ja luua AI kohta uusi teadmisi.

Lõpptöö kasulikkus peaks seepärast aitama teil saavutada kolme asja: mõistma toimuvat ja omama kaarti, mida järgida; mõistmine, kus masinluuret tänapäeval kasutatakse (seoses sellega, kus seda varem ei kasutatud); mõistmine, mida ja kui palju probleeme on ümber kujundatud, et võimaldada AI-l neid lahendada (kui olete tuttav Agrawal jt tööga, 2018 on need ennustamistehnoloogiate kulude languse otsesed tagajärjed).

Põhimõtteliselt on see artikkel suunatud nii AI-s alustavatele inimestele, et anda neile laiem ülevaade sellest, mis seal on, kui ka ekspertidele ja praktikutele, kes katsetavad neid tehnoloogiaid mõnda aega (koos sõnaselge palvega saata mulle tagasisidet selle kohta, kuidas struktureeriksite selle või muud tehnoloogiad, mis peaksid kuuluma AI spektrisse).

Ma tean ka väga hästi, et see on ambitsioonikas ülesanne, nii et vaadake seda pigem kui esimest mustandit või katset seda teha, mitte kui lõplikku sisseehitatud lahendust.

Lubage mul ka see sissejuhatus lõpetada millegagi, mille sain teada visuaali loomise eesmärgi saavutamiseks: see on väga-väga raske. Proovida võimalikult palju teavet kahemõõtmelises mittemidagiütlevas kaardis esitada on olnud ülimalt keeruline, midagi ei saa te aru enne, kui proovite seda ise teha. Kutsun teid kõiki üles tegema sama, et aru saada, mida ma mõtlen (uskuge mind, see pole üldse lihtne, eriti arvestades arvamuste, seisukohtade ja lähenemisviiside lahknevust AI-s viimase 60 aasta jooksul). See viib mu lõpliku vastutusest loobumiseni: mõnikord pidin täpsuse ja selguse vahelise kompromissi säilitamiseks lähendama mõisteid või klassifikatsiooni ise, nii et andke mulle ette, kui ta on mõne väiksema (või kellegi silmis suure) väärkajastamise andestanud.

Liigume nüüd AI teadmiste kaardile (AIKM).

II. Probleemidomeen + lähenemisviis = tehnoloogialahendus

Nii et siin me läheme, see selleks. Tõenäoliselt ootasite tutvustamise korral imelikku VR-mootorit, mis projitseeriks iga tehnoloogia jaoks mitu tulede kimp, kuid see on pigem vanamoodne kahemõõtmeline graafik. Nii lihtne see ongi.

Vaatame seda natuke lähemalt.

Telgedel leiate kaks makrorühma, st AI paradigmad ja AI probleemdomeenid. AI paradigmad (X-telg) on ​​tõepoolest lähenemisviisid, mida AI teadlased kasutavad konkreetsete AI-ga seotud probleemide lahendamiseks (see hõlmab ka lähenemisviise, millest oleme ajakohased). Teiselt poolt on AI probleemdomeenid (Y-telg) ajalooliselt seda tüüpi probleemid, mida AI saab lahendada. Mõnes mõttes osutab see ka AI-tehnoloogia võimalikele võimalustele.

Seetõttu olen tuvastanud järgmised AI paradigmad:

  • Loogikal põhinevad tööriistad: tööriistad, mida kasutatakse teadmiste esitamiseks ja probleemide lahendamiseks;
  • Teadmistepõhised tööriistad: ontoloogiatel ja tohututel mõistete, teabe ja reeglite andmebaasidel põhinevad tööriistad;
  • Tõenäosuslikud meetodid: tööriistad, mis võimaldavad agentidel tegutseda mittetäieliku infostsenaariumi korral;
  • Masinõpe: tööriistad, mis võimaldavad arvutitel andmetest õppida;
  • Kehtestatud intelligentsus: inseneri tööriistakast, mis eeldab, et kõrgema intelligentsuse jaoks on vaja keha (või vähemalt osalist funktsioonide komplekti, näiteks liikumist, tajumist, interaktsiooni ja visualiseerimist);
  • Otsimine ja optimeerimine: tööriistad, mis võimaldavad arukalt otsida paljude võimalike lahenduste kaudu.

Need kuus paradigmat jagunevad ka kolme erinevasse makro-lähenemisviisi, nimelt sümboolsesse, alam-sümboolsesse ja statistilisse (esindatud erinevate värvidega). Lühidalt, sümboolne lähenemisviis väidab, et inimese intelligentsus võiks taandada sümbolitega manipuleerimisele, alamsümboolsele, et teadmiste konkreetseid esitusi ei tohiks ette anda, samas kui statistiline lähenemisviis põhineb matemaatilistel tööriistadel konkreetsete alamprobleemide lahendamiseks.

Kiire lisamärkus: võite kuulda inimesi rääkimas „AI hõimudest” - kontseptsioonist, mille pakkus välja Pedro Domingos (2015) ja mis koondab teadlased rühmadesse, lähtudes lähenemistest, mida nad kasutavad probleemide lahendamisel. Neid viit hõimu saate hõlpsalt kaardistada meie paradigma klassifikatsiooniga (võtmata arvesse kehastatud luuregruppi), st loogikal põhineva lähenemisega sümbolistid (nad kasutavad loogilisi põhjendusi, mis põhinevad abstraktsetel sümbolitel); Connectionists with Machine learning (nad on inspireeritud imetaja ajust); Evolutsioonid otsimise ja optimeerimisega (nad on inspireeritud darvini evolutsioonist); Tõenäosuslike meetoditega Bayesilased (nad kasutavad tõenäosuslikku modelleerimist); ja lõpuks teadmispõhiste meetoditega analoogid, kuna nad proovivad ekstrapoleerida olemasolevaid teadmisi ja varasemaid sarnaseid juhtumeid.

Vertikaaltelg sätestab hoopis probleemid, mille jaoks AI on kasutatud, ja klassifikatsioon on siin üsna standardne:

  • Põhjendus: võime probleeme lahendada;
  • Teadmised: võime esindada ja mõista maailma;
  • Planeerimine: eesmärkide seadmise ja saavutamise võime;
  • Suhtlus: oskus keelt mõista ja suhelda;
  • Taju: võime muuta töötlemata sensoorsed sisendid (nt pildid, helid jne) kasutatavaks teabeks.

Uurin endiselt endalt, kas see klassifikatsioon on piisavalt suur, et hõlmata kõiki praegu silmitsi seisvate probleemide spektrit või tuleks lisada veel juhtumeid (nt loovus või liikumine). Praegu hoian siiski kinni 5 klastriga.

Selle asemel jagavad kastide mustrid tehnoloogiad kahte rühma, st kitsad rakendused ja üldised rakendused. Kasutatavad sõnad on tahtlikult pisut eksitavad, kuid kannavad mind ühe sekundi jooksul ja seletan, mida ma mõtlesin. Kõigile, kes alustavad AI-st, on ülioluline teada erinevust nõrga / kitsa AI (ANI), tugeva / üldise AI (AGI) ja tehisliku intelligentsuse (ASI) vahel. Selguse huvides on ASI lihtsalt ajakohane spekulatsioon, General AI on teadlaste lõplik eesmärk ja püha graal, samal ajal kui kitsas AI on see, mis meil täna tegelikult on, st tehnoloogiate kogum, mis ei suuda millegagi hakkama saada väljaspool nende reguleerimisala (mis on peamine erinevus AGI-ga).

Seejärel tahavad graafikus kasutatud kahte tüüpi read (pidevad ja punktiirjooned) sellele erisusele selgesõnaliselt osutada ja veenduda, et mõnda muud sissejuhatavat AI-materjali lugedes ei kaota te end täielikult. Kuid samal ajal visandab erinevus siin tehnoloogiad, mis suudavad lahendada ainult konkreetse ülesande (tavaliselt paremini kui inimesed - kitsad rakendused) ja muud, mis suudavad täna või tulevikus lahendada mitmeid ülesandeid ja suhelda maailmaga (parem kui paljud inimesed) - üldised rakendused).

Lõpuks vaatame, mis graafil endas on. Kaardil on esindatud AI-tehnoloogiate erinevad klassid. Pange tähele, et ma ei nimeta tahtlikult konkreetseid algoritme, vaid koondan need makrorühmadesse. Ma ei paku teile ka väärtushinnangut selle kohta, mis see töötab ja mis mitte, vaid lihtsalt loetlen, mida teadlased ja andmeteadlased saavad kasutada.

Kuidas siis kaarti lugeda ja tõlgendada? Lubage mul tuua teile kaks näidet, mis aitavad teil seda teha. Kui vaadata looduskeele töötlemist, hõlmab see algoritmide klassi, mis kasutab tajumise valdkonna probleemide lahendamiseks teadmistepõhist lähenemist, masinõpet ja tõenäosusmeetodeid. Kuid samal ajal, kui vaadata tühja ruumi loogikapõhise paradigma ja mõtlemisprobleemide ristumiskohas, võiksite küsida, miks seal tehnoloogiaid pole. See, mida kaart edastab, ei seisne selles, et kategooriliselt ei eksisteeri meetodit, mis seda ruumi täidaks, vaid pigem selles, et mõtlemisprobleemidele lähenedes eelistavad nad pigem kasutada näiteks masinõppe meetodit.

Selle selgituse lõpetuseks on esitatud täielik loetelu tehnoloogiatest koos nende endi määratlustega:

  • Robotprotsesside automatiseerimine (RPA): tehnoloogia, mis eraldab reeglite ja toimingute loendi, jälgides, kuidas kasutaja teatud ülesannet täidab;
  • Ekspertsüsteemid: arvutiprogramm, millel on kõvasti kodeeritud reeglid inimese otsustusprotsessi jäljendamiseks. Hägusad süsteemid on konkreetne näide reeglipõhistest süsteemidest, mis kaardistavad muutujad väärtuste pidevuseks vahemikus 0 kuni 1, vastupidiselt traditsioonilisele digitaalsele loogikale, mille tulemuseks on 0/1;
  • Arvutivisioon (CV): meetodid digitaalkujutiste omandamiseks ja mõistmiseks (tavaliselt jagunevad tegevuste tuvastamiseks, piltide äratundmiseks ja masinnägemiseks);
  • Looduslik keele töötlemine (NLP): alamväli, mis haldab loomuliku keele andmeid (sellesse välja kuuluvad kolm peamist plokki, st keele mõistmine, keele genereerimine ja masintõlge);
  • Neuraalsed võrgud (NN või ANN): algoritmide klass, mis on inimese või looma aju närvistruktuuri järgi lõdvalt modelleeritud ja mis parandab selle jõudlust, ilma et oleks selgesõnaliselt juhendatud, kuidas seda teha. NN-i kaks peamist ja tuntud alamklassi on Deep Learning (mitmekihiline neurovõrk) ja Generative Adversarial Networks (GAN - kaks võrku, mis treenivad üksteist);
  • Autonoomsed süsteemid: alamväli, mis asub robootika ja intelligentsete süsteemide ristumiskohas (nt arukas taju, osavate objektidega manipuleerimine, plaanipõhine roboti juhtimine jne);
  • Hajutatud tehisintellekt (DAI): tehnoloogiate klass, mis lahendab probleeme, levitades neid üksteisega suheldes autonoomsetele „agentidele“. Mitmeagentsilised süsteemid (MAS), agendipõhine modelleerimine (ABM) ja sülemintelligentsus on selle alamhulga kolm kasulikku spetsifikatsiooni, kus kollektiivne käitumine tuleneb detsentraliseeritud iseorganiseeritud esindajate koostoimest;
  • Afektiivne arvutamine: alamväli, mis tegeleb emotsioonide äratundmise, tõlgendamise ja simuleerimisega;
  • Evolutsioonilised algoritmid (EA): see on laiema infotehnoloogia valdkonna alamhulk, mida nimetatakse evolutsiooniliseks arvutamiseks ja mis kasutab optimaalsete lahenduste otsimiseks bioloogiast inspireeritud mehhanisme (nt mutatsioon, paljunemine jne). Geneetilised algoritmid on EA-de kõige sagedamini kasutatavad alamrühmad, mis on otsingu heuristikad, mis järgivad loodusliku valiku protsessi, et valida “kõige sobivam” kandidaatlahendus;
  • Induktiivne loogikaprogrammeerimine (ILP): alamväli, mis kasutab formaalset loogikat faktide andmebaasi esitamiseks ja nendest andmetest tuleneva hüpoteesi sõnastamiseks;
  • Otsustusvõrgud: üldistus kõige tuntumate Bayesia võrkude / järelduste kohta, mis tähistavad muutujate komplekti ja nende tõenäosussuhteid kaardi kaudu (nimetatakse ka suunatud atsükliliseks graafiks);
  • Tõenäoline programmeerimine: raamistik, mis ei sunni teid konkreetset muutujat kodeerima, vaid töötab tõenäosuslike mudelitega. Bayes'i programmi süntees (BPS) on kuidagi tõenäosusliku programmeerimise vorm, kus Bayes'i programmid kirjutavad uusi Bayesia programme (inimeste asemel teevad seda, nagu laiemas tõenäosusliku programmeerimise lähenemisviisis);
  • Ümbritsev intelligentsus (AmI): raamistik, mis nõuab füüsilistelt seadmetelt digitaalsesse keskkonda, et tajuda, tajuda ja reageerida konteksti teadlikkusega välisele stiimulile (mille tavaliselt käivitab inimtegevus).

Konkreetse probleemi lahendamiseks võiksite järgida ühte või mitut lähenemisviisi, mis omakorda tähendab ühte või mitut tehnoloogiat, arvestades, et paljud neist ei ole sugugi üksteist välistavad, vaid pigem täiendavad üksteist.

Lõpuks on veel üks asjakohane klassifikatsioon, mida ma pole ülalolevasse graafikusse manustanud (s.o erinevat tüüpi analüütika), kuid mida tasub mainida täielikkuse huvides. Tegelikult võite kohata viit erinevat tüüpi analüütikat: kirjeldav analüüs (mis juhtus); diagnostiline analüüs (miks midagi juhtus); ennustav analüüs (mis saab toimuma); ettekirjutav analüüs (toimingute soovitamine); ja automatiseeritud analüüs (toimingute automaatne tegemine). Teil võib tekkida kiusatus kasutada seda ka ülaltoodud tehnoloogiate mingil viisil klassifitseerimisel, kuid tegelikkus on selline, et tegemist on funktsionaalse klassifikatsiooni ja protsessiprotsessiga, mitte toote klassifikaatoriga - teisisõnu, iga spektri tehnoloogia suudab täita neid viit analüütilisi funktsioone. .

III. Järeldus

Arvutite õpetamine, kuidas õppida, ilma et oleks vaja selgesõnalist programmeerimist, on keeruline ülesanne, mis hõlmab mitut tehnoloogiat, et käsitleda mitmeid nüansse, ja kuigi see kaart pole kaugeltki täiuslik, on see vähemalt esimene katse mõtestada räpane maastik nagu tehisintellekti oma.

Olen täiesti teadlik, et siin ilmneb tugev Pareto põhimõte, st 80% (kui mitte rohkem) praegustest jõupingutustest ja tulemustest ajendab 20% kaardil kujutatud tehnoloogiatest (nimelt süvaõpe, NLP ja arvuti visioon), kuid olen ka kindel, et täieliku spektri olemasolu võib aidata teadlasi, alustavaid ettevõtteid ja investoreid.

Lisaks sellele, et proovida kinnistada ja kaaluda tagasisidet ja kommentaare selle esimese versiooni kohta, plaanin tulevikus astuda veel kaks sammu: üks on luua kiht tüüpi väljakutsetele, millega AI silmitsi seisab (nt mäluprobleemid ja katastroofiline unustamine, õppe ülekandmine, vähem andmetest õppimine, näiteks null- ja üheharjutusega õppimine jne) ja millist tehnoloogiat saab selle konkreetse probleemi lahendamiseks kasutada. Teiseks proovitakse läätsesid vaadelda erinevate tehnoloogiate ja mitte nende lahendatavate probleemide, vaid pigem nende, mida nad loovad (nt eetikaküsimused, andmemahukad probleemid, musta kasti ja seletatavuse probleem jne) jaoks.

Kui teil on kommentaare olemasoleva töö parendamiseks või ettepanekuid nende kahe lisaetapi kinnistamiseks, võtke ühendust!

Ja kui te olete ettevõte, mis töötab mõne ülalnimetatud tehnoloogiaga, siis tahaksin teile rohkem teada saada.

Avalikustamine: AI teadmiste kaart töötati välja koos strateegilise innovatsiooninõustaja Axiloga nende Chôra platvormil toimuvate tegevuste jaoks.

Viited

Agrawal, A., Gans, J., Goldfarb, A. (2018). “Ennustusmasinad: tehisintellekti lihtne ökonoomika”. Harvard Business Review Press.

Domingos, P. (2015). „Peamine algoritm: kuidas ülima õppemasina otsimine muudab meie maailma uueks”. New York: põhiraamatud.