Sisukord
- Sissejuhatus masinõppesse
- Masinõpe
- Juhendatud õpe
- Regressioon
- Lineaarse regressiooni algoritm
- Klassifikatsioon
- Toetage vektormasinat
- Järelevalveta õppimine
- K-tähendab klasterdamist
- Pooljärelevalvega algoritm
- Tugevdusõpe
- Sügav õppimine
- Sügav närvivõrk
- Tehisintellekti rakendused
- Soovitatavad artiklid
Sissejuhatus masinõppesse
Teadlased on juba ammu unistanud kujutlusvõimega masinate ehitamisest. Kui programmeeritavad personaalarvutid esmakordselt leiutati, mõtlesid inimesed, kas sellised masinad saavad ühel päeval intelligentseteks nagu inimesed ja suudavad täita ülesandeid nagu inimesed. Tänapäeval on tehisintellekt arenev tehnoloogia, millel on lai valik rakendusi erinevates valdkondades. AI kontseptsioon seisneb inimese intelligentsuse simuleerimises tehismasinateks, nii et masinad suudavad mõelda ja ülesandeid täita nagu inimesed.
Miks me vajame tehnoloogiat, mis töötaks kõigis aspektides nagu inimesed?
Inimestel on töö tegemise täpsus väga hea, kuid töö efektiivsus ei ole rahuldav ja inimese töö kiirendamisel on alati piir, kuid masinate puhul see nii ei ole ja ka masinate töö on väga täpne, ühtlane ja skaleeritav.
19. sajandil toimus nende probleemide ületamiseks tarkvara revolutsioon, kuid sellest ei piisa nende probleemide lahendamiseks. Tarkvara on võimeline täitma ülesannet, mis on formaalselt määratletud reeglite kogumiga, nii et programmeerija suudab neid reegleid arvesse võttes programmi kirjutada.
Näiteks kahe antud arvu summa arvutamine. Tänapäeva maailmas suudavad arvutid kiiruse ja täpsuse poolest selles ülesandes ületada iga inimest. Kuid probleeme, millel pole formaalseid reegleid ja mis nõuavad inimese intelligentsust, on selliseid probleeme arvutitega väga raske lahendada.
Näiteks nägude äratundmiseks suudavad inimesed nägusid väga lihtsalt ära tunda, kuid arvutitel on seda väga raske ära tunda, sest nägude formaalseid reegleid on väga keeruline kirjutada. Seega on tehisintellekti tõeline väljakutse lahendada ülesandeid, mida inimestel on lihtne täita, kuid mida on raske vormiliselt kirjeldada.
Võtame näiteks IBMi välja töötatud Deep Blue malemängusüsteemi. Malereeglid saab täielikult määratleda formaalsete reeglite kogumiga. Seega konverteeris programmeerija need reeglid hõlpsalt programmiks ja andis need ette.
Tehisintellekt püüab selle väljakutsega toime tulla, kandes inimintellekti üle võrreldamatu arvutusvõimega masinatele.
Igapäevaelus nõuab inimene oma ülesande lahendamiseks teadmisi maailma kohta ning selline teadmine on subjektiivne ja intuitiivne, mistõttu on programmeerijal raske reegleid sõnastada.
Siit saame aru, et selleks, et käituda nagu inimesed või teisisõnu intelligentselt käituda, vajavad arvutid sarnaseid teadmisi. Seega on tehisintellekti peamiseks väljakutseks panna see mitteametlik või subjektiivne teave arvutisse ja tehistehnoloogia teadlastele. Luureväli püüab põhimõtteliselt seda eesmärki saavutada.
Teadlased leidsid selle eesmärgi saavutamiseks väga lihtsa viisi. Nad on kasutanud teadmistepõhist lähenemist. Selle lähenemisviisi kohaselt kodeerivad teadlased teadmised maailma kohta ametlikes keeltes.
Arvutid saavad loogiliste järeldusreeglite abil nendes formaalsetes keeltes väidete üle automaatselt arutleda. Kuna see on väga elementaarne, lihtne ja naiivne lähenemine, ei ole projekt selle lähenemisviisi kasutamine edukas, sest teadlastel on raske välja töötada formaalseid reegleid, mis on piisavalt keerukad, et maailma täpselt välja mõelda. Üks näide sellisest projektist on Cyc. Cyc on järeldusmootor.
Ülaltoodud (teadmistepõhisel lähenemisviisil põhinevate) projektide ees seisev raskus seisneb kõvasti kodeeritud teadmistes. Selle raskuse ületamiseks vajavad AI-süsteemid võimet omandada maailmast oma teadmisi, eraldades toorandmetest mustreid. Seda võimalust tuntakse masinõppena.
Masinõpe
Masinõppe kasutuselevõtt annab arvutitele võimaluse omandada teadmisi reaalsest maailmast ja teha otsuseid, mis näivad subjektiivsed. Sel viisil suudab masinõpe ületada teadmistepõhise lähenemisviisi piirangud.
Wikipedia andmetel
Masinõpe on arvutialgoritmide uurimine, mis paraneb automaatselt kogemuste kaudu.
Mitchelli sõnul
Väidetavalt õpib arvutiprogramm kogemusest E seoses mõne ülesannete klassiga T ja tulemusnäitaja P, kui selle toimivus ülesandes T, mõõdetuna P-ga, paraneb kogemusega E.
Kirjanduses on mitut tüüpi masinõppe algoritme. Siin toimub algoritmide rühmitamine õpistiili alusel. Masinõppe algoritmide algoritmide lai rühmitus on näidatud joonisel 1. Vaatame üksikasjalikult ükshaaval.

Masinõppe algoritmi rühmitamine õpistiili alusel
Juhendatud õpe
Juhendatud õppimine, nagu nimigi ütleb, on juhendaja kohalolek õpetajana. Juhendatud õppes treenime oma masinat märgistatud andmete abil. Märgistatud andmed tähendab, et iga sisendi jaoks on hästi märgistatud väljund.
Koolituse käigus omandavad masinad märgistatud andmete põhjal teadmisi maailmast. Pärast treenimist antakse masinale tulemuse ennustamiseks uus andmekogum. Eesmärk on panna masinad õppima koolitusandmestikust saadud sarnastest mustritest ja rakendama õpitud teadmisi testitavas andmekogumis, et ennustada reaalse väärtusega väljundit.
Parema mõistmise jaoks võtame näite Irise andmekogumist. Iirise andmestik on 150 iirise taime erinevate osade mõõtmiste kogum. Iga andmestiku näide koosneb taime iga osa mõõtmisest, nagu tupplehe pikkus, tupplehe laius, kroonlehe pikkus, kroonlehe laius. Andmekogus registreeritakse ka see, millistesse liikidesse iga taim kuulub. Andmekogus on kolm erinevat liiki. Nagu näeme siin iirise andmestikus, on iga iirise taim märgistatud selle liigiga.
Vaata ka 15 parimat müügihaldustarkvaraJärelevalvega õppealgoritmid saavad seda andmestikku uurida ja iirise taime mõõtmiste põhjal kolmeks erinevaks liigiks klassifitseerida.
Mõiste juhendatud õpe tähendab põhimõtteliselt seda, et sihtmärk y, mille annab õpetaja, kes näitab masinale, mida teha.
Juhendatud õpe liigitatakse kahte algoritmikategooriasse, nagu on näidatud joonisel:2.

Regressioon
Regressioonialgoritmid ennustavad pidevat tulemust (sihtmärki) ühe või mitme sisendi või ennustaja väärtuse põhjal. Lihtsamalt öeldes on väljundväärtus reaalne väärtus nagu kaalud.
Regressioonialgoritme on mitmesuguseid. Erinevate regressioonialgoritmide tüübid sõltuvad sõltumatute muutujate arvust, regressioonijoone kujust ja sõltuva muutuja tüübist. Vaatame mõnda tüüpi regressioonitehnikaid.
Lineaarne regressioon on üks põhilisemaid ja populaarsemaid regressioonialgoritme pideva väärtuse ennustamiseks. Siin eeldab see lineaarset seost sisendi (ennustaja) ja väljundi vahel.
Lineaarse regressiooni algoritm
Lineaarse regressiooni nimetused viitavad sellele, et see suudab lahendada regressiooniprobleeme. Nende algoritmide eesmärk on luua süsteem, mis suudab võtta vektori x ja ennustada väljundina skalaarväärtust y. Lihtsamalt öeldes loob see algoritm sisendi ja väljundi vahelise seose, kasutades kõige paremini sobivat sirgjoont.
y=wTx
Siin w on parameetrite vektor. Parameetrid on väärtused, mis kontrollivad süsteemi käitumist.
Võime mõelda 'w'-le kui kaalude komplektile, mis määravad, kuidas iga funktsioon väljundit mõjutab. Funktsioon pole midagi muud kui sisendile iseloomulik.
Näiteks
Oletame, et tahame süsteemi, mis suudab ennustada kasutatud autode hinda. Siin on funktsioonid auto atribuudid, mis meie arvates mõjutavad auto väärtust, nagu mark, aasta, mootori efektiivsus, töömaht, läbisõit ja palju muud teavet.
y=w0 * töömaht+w1 * läbisõit +w3 * mootori kasutegur
kui need tunnused saavad positiivseid kaalusid, siis nende kaalude suurenemine suurendab meie ennustuse väärtust ja vastupidi. Kui kaal 'wi' on suur, mõjutab see prognoosimist suuresti. Kui kaal 'wi' on 0, ei mõjuta see ennustust.
Klassifikatsioon
Klassifikatsioon on juhendatud õppekontseptsioon, mis püüab ennustada kategooriaid, millesse sisend kuulub. Klassifitseerimisprobleemi lahendamiseks proovivad õppealgoritmid luua funktsiooni f:R-{1,2,…k}. Lihtsamalt öeldes, kui väljund on muutuv, on kategooria nagu haigus või mittehaigus, st selles ülesandes on väljund diskreetne. Näiteks Iirise andmekogus peame ennustama kolme liiki liike, millel on sisendis kolm tunnust (tupplehe pikkus (sl), tupplehe laius (sw), kroonlehe pikkus (pl), kroonlehe laius (pw)).
Selle selgeks mõistmiseks võtame veel ühe näite objektide tuvastamisest
Siin on sisendiks pilt ja väljundiks numbriline kood, mis tuvastab pildil oleva objekti.
Klassifitseerimisalgoritme on mitmeid. Klassifitseerimisalgoritmid hõlmavad tugivektori masina logistilist regressiooni, otsustuspuud, juhuslikku metsa jne. Vaatame mõnda algoritmi üksikasjalikult.
Toetage vektormasinat
Tugivektorimasin on juhendatud õppealgoritm, mida saab kasutada nii klassifitseerimis- kui ka regressiooniprobleemide lahendamiseks, kuid enamasti kasutatakse seda klassifitseerimisprobleemide lahendamiseks.
Arvestades koolitusandmestikku, millest igaüks on märgistatud ühe või teise klassina kahest, koostab SVM-i treeningalgoritm mudeli, mis määrab ühele või teisele kategooriale uued näited, muutes selle mittetõenäosuslikuks binaarseks lineaarseks klassifikaatoriks.
Põhimõtteliselt püüab see algoritm leida optimaalset hüpertasandit n-mõõtmelises kohas, mis klassifitseerib uued näited. Kahemõõtmelises ruumis (kui sisendfunktsioonide arv on kaks) pole see hüpertasand midagi muud kui joon, mis jagab tasapinna kaheks osaks, nagu on näidatud joonisel3.
Vastavalt wikipedia
SVM-mudel on näidete esitus punktidena ruumis, mis on kaardistatud nii, et eraldiseisvate kategooriate näited jaotatakse selge, võimalikult laia vahega. Seejärel kaardistatakse uued näited samasse ruumi ja ennustatakse, et nad kuuluvad kategooriasse, mis põhineb lõhe poolel, millele nad langevad.
Joonis 3
SVM püüab maksimeerida kahe klassi vahelist varu. Maksimaalse varu saavutab hüpertasand, millel on suurim kaugus mis tahes klassi lähima treeningu andmepunktini.
Seda on väga intuitiivne mõista. Jooniselt näeme, et kõik andmepunktid, mis jäävad joone küljele, märgistatakse üheks klassiks ja punktid, mis jäävad teisele poole joont, märgistatakse teise klassina. Nüüd, nagu näeme joonisel 3, on nende vahelt möödas lõpmatu arv jooni.
Niisiis, kuidas me teame, milline rida toimib kõige paremini? See algoritm püüab valida joone, mis mitte ainult ei eralda kahte klassi, vaid jääb võimalikult kaugele lähimatest proovidest, nagu on näidatud joonisel 3.
Järelevalveta õppimine
Juhendatud õppe puhul on eesmärgiks õppida kaardistamist sisendist väljundini, mille õiged väärtused annab juhendaja. Juhendajata õppe puhul antakse ainult sisendandmed ja sellist juhendajat pole. Eesmärk on leida sisendi seaduspärasused.
Sisestusruumi struktuur on selline, et mõned mustrid esinevad rohkem kui teised.
Vaata ka 9 parandusi Google Chrome'i mitme protsessi käigusJuhendajata õppes kasutatakse kahte peamist meetodit: klastrianalüüs ja põhikomponent.
Klasteranalüüsis on eesmärgiks leida sisendi rühmitus.
Arusaadavaks mõistmiseks võtame näite
Kõikidel ettevõtetel on palju kliendiandmeid. Kliendiandmed sisaldavad nii demograafilist teavet kui ka varasemat tehingut ettevõttega. Ettevõte võib olla huvitatud oma ettevõtte profiili levitamisest, et näha, millist tüüpi kliente sageli esineb. Selliste stsenaariumide korral eraldab rühmitamine oma atribuutide poolest sarnased kliendid samasse rühma. Need rühmitatud rühmad võivad aidata otsustada ettevõtte strateegiate üle, näiteks teenuste ja toodete osas, mis on spetsiifilised erinevatele rühmadele.
Populaarne algoritm selle rühmitusanalüüsi tegemiseks on K-keskmiste klasterdamine. Räägime K-vahenditest üksikasjalikumalt.
K-tähendab klasterdamist
K-keskmiste klasterdamine on üks populaarsemaid ja lihtsamaid järelevalveta õppimisalgoritme.
K-means on tsentroidipõhine algoritm, kus arvutame antud punktide kaugused tsentroidist, et määrata punkt klastrile. K-Meansis on iga klaster seotud tsentroidiga.
See algoritm töötab järgmiselt:
- Esiteks lähtestage k punkti juhuslikult, mida nimetatakse vahenditeks
- Seejärel kategoriseerige iga üksus lähima keskmise järgi ja värskendage keskmise koordinaate, mis on seni selle keskmisena liigitatud üksuste keskmised.
- Korrake neid samme teatud arvu iteratsioonide jaoks ja pärast antud arvu iteratsioone on meil oma klastrid.

Pooljärelevalvega algoritm
Juhendatud õppes oleme näinud, et inimesed peavad andmestiku käsitsi märgistama. See protsess on väga kulukas, kuna andmestiku maht on väga suur. Järelevalveta õppe puhul pole märgistatud andmestik vajalik, kuid selle rakendusspekter on piiratud.
Nende piirangute kõrvaldamiseks võetakse kasutusele pooljuhitud õppe kontseptsioon. Selles õppestiilis treenitakse algoritmi väikese koguse märgistatud andmete ja suure hulga märgistamata andmete kombinatsiooniga. Pool-superviseeritud õpe jääb juhendatud õppimise ja juhendamata õppimise vahele.
Märgistamata andmete kasutamiseks eeldab pooljärelevalvega algoritm andmetega järgmist seost –
- Isejuhtiv auto
- Roboti mootori juhtimine
- Konditsioneeri juhtimine
- Reklaami paigutuse optimeerimine
- Aktsiaturu kauplemisstrateegiad
- Mängu mängimine
-
Mis on Unsecapp.exe ja kas see on ohutu?
-
15 parimat UML-i diagrammi tööriista ja tarkvara
-
[PARANDATUD] Windows ei pääse määratud seadmele, teele või failiveale juurde
-
16 Windows Update'i parandusi, mis Windowsis ei tööta
-
4 AMD Radeoni seadete parandused ei avane
-
Suumi ekraanipildi tööriist: näpunäiteid ja nippe
Saame mõista neid kolme tüüpi õpistiile, nimelt juhendatud õppimist, juhendamata õppimist ja pooleldi juhendatud õppimist, suhestudes reaalse maailmaga.
Juhendatud õpe, kus õpilane on õpetaja juhendamisel. Juhendajata õppes, kus õpilane peab ise kontseptsiooni välja mõtlema. Pooljuhitav õpe, kus õpetaja õpetab tunnis mõned mõisted ja esitab kodutööna küsimusi, mis põhinevad sarnastel kontseptsioonidel.
Tugevdusõpe
Tugevdusõpe on õppimine keskkonnaga suheldes. Õppeprotsess hõlmab näitlejat, keskkonda ja tasu signaali. Näitleja valib tegutsemise keskkonnas, mille eest näitlejat vastavalt premeeritakse. Siin on süsteemi väljund toimingute jada.
Sellisel juhul pole oluline üksik tegevus, siin on oluline parandusmeetmete jada eesmärgini jõudmiseks. Seda nimetatakse ka poliitikaks. Näitleja soovib saadavat tasu suurendada ja seetõttu peab ta õppima optimaalse ja hea poliitika keskkonnaga suhtlemiseks. Hea näide on mängud. Mängus ei ole üksik käik iseenesest oluline, see nõuab õigete käikude jada, mis on hea (st käigud viivad võiduni)

Joonis 5: Tugevdamise õppe seadistus
`Tugevdusõpe erineb oluliselt teistest õppeliikidest, mida oleme seni käsitlenud. Nagu oleme juhendatud õppes näinud, antakse meile andmed ja sildid ning meie ülesandeks on ennustada antud väljundandmeid. Järelevalveta õppimisel antakse meile ainult andmed ja ülesandeks on leida andmetest alusstruktuur. Tugevdamisel ei anta meile andmeid ega silte.
Tugevdusõppe rakendused on
Sügav õppimine
Kui analüüsime auto pilti, siis punase auto pildi üksikpiksel on öösel väga lähedal mustale. See näide võib anda teile ülevaate paljude tehisintelligentsete rakenduste raskustest. Nii kõrgetasemelisi ja abstraktseid jooni on väga raske välja tõmmata, sest see nõuab inimtasandi mõistmist.
Süvaõpe lahendab selle probleemi, luues lihtsatest keerukatest funktsioonidest. Süvaõppe mudeli kõige elementaarsem näide on Multilayer Perceptron. Mitmekihiline Perceptron on lihtsalt matemaatiline funktsioon, mis seostab sisendväärtused väljundväärtustega. See funktsioon koosneb paljudest lihtsamatest funktsioonidest.
Süvaõpe on teatud tüüpi masinõpe, mis saavutab suure võimsuse ja paindlikkuse, kujutades maailma mõistete pesastatud hierarhiana. Iga mõiste määratleti seoses lihtsamate mõistetega ja abstraktsemate esitustega, mis on arvutatud vähem abstraktsete mõistete järgi.
Süvaõppe algoritme, nagu sügav närvivõrk, sügavusklik võrk, konvolutsiooniline närvivõrk, korduv närvivõrk, on rakendatud sellistes valdkondades nagu arvutinägemine, kõnetuvastus, loomuliku keele töötlemine ja palju muud.
Sügav närvivõrk
Deep Neural Network on inspireeritud inimese aju funktsioonist ja selle toimimisest. Sügavate närvivõrkude põhiliseks ehitusplokiks on sõlmed. Sõlmed on täpselt nagu inimese aju neuronid. Kui stiimul neid tabab, toimub sõlmes protsess. Üldiselt on sõlmed rühmitatud kihtideks, nagu on näidatud joonisel 6.

Joonis 6: Deep Neural Network
Sügavaid närvivõrke on erinevat tüüpi ja nendevahelised erinevused seisnevad nende tööpõhimõtetes, tegevusskeemis ja rakendusvaldkondades.

Vaatame tehisintellekti, masinõppe ja süvaõppe vahelisi seoseid Venni diagrammi abil

Joonis 7: see joonis näitab seost süvaõppe, masinõppe ja tehisintellekti vahel.
Tehisintellekti rakendused
Tehisintellekti kasutatakse palju erinevaid valdkondi. Valdkondade hulka kuuluvad turundus, pangandus, rahandus, põllumajandus, tervishoid, mängud, kosmoseuuringud, autonoomsed sõidukid, vestlusrobotid, kunstlik loovus jne.
Uurime turunduse ja panganduse valdkonda.
Turundus
Esimestel aegadel (kui tehisintellekti ei kasutata. See on olemas ainult raamatutes), kui tahame mõnda toodet veebipoest osta, peame otsima toodet selle täpse nimega. Seega on väga raske toodet leida, kui me ei tea toote täpset nimetust.
Kuid tänapäeval, kui me otsime mis tahes kaupa mis tahes e-poest, saame kõik võimalikud selle kaubaga seotud tulemused. Me ei pea toote leidmiseks muretsema täpse kirjapildi või tootenime pärast. Teine näide on Netflixist õigete filmide leidmine.
Rakendus ei piirdu ainult õige toote leidmisega. Tehisintellekti areng suudab soovitada toodet teie huvi põhjal, analüüsides teie varasemaid tehinguid ja asjade ostmise maitset. Nende andmete järgi saab AI teada, mis tüüpi toode on teie jaoks asjakohane ning selle põhjal filtreerib toote ja soovitab seda teile.
Sel moel mängib tehisintellekt olulist rolli toodete turundamisel ja veebimüügi suurendamisel ning seega ka e-kaubanduse ettevõtetel, nagu Flipkart, Amazon , või Netflixi sarnased ettevõtted kasutavad tehisintellekti võimet, et müüa oma tooteid väga lihtsalt ja teenida kasumit.
Pangandus
Panganduses kasvab tehisintellekti süsteem kiiremini. Paljud pangad on AI-süsteemi juba kasutusele võtnud, et pakkuda erinevaid teenuseid, nagu klienditugi, kõrvalekallete tuvastamine, krediitkaardipettused.
Võtame näite HDFC pangast. Nad on välja töötanud AI-põhise vestlusroti nimega Electronic Virtual Assistant (EVA). See vestlusbot on juba vastanud enam kui 3 miljonile kliendipäringule. Eva suudab anda lihtsaid vastuseid vähem kui 0,4 sekundiga. Bank of America kannab oma vestlusroboti nime Erica. American Express kasutab oma AmEX-i vestlusroboteid oma klientide kasu saamiseks.
MasterCard ja RBS WorldPay on kasutanud tehisintellekti ja süvaõpet, et tuvastada petturlikke tehinguid ja vältida kaardipettusi. See AI-süsteem säästis miljoneid dollareid. AI-põhised pettuste tuvastamise algoritmid on pettuste tuvastamisel täpsemad täpsusega üle 95%. Nad suudavad kiiresti kohaneda, et avastada reaalajas uusi pettuskatseid.
Tehisintellekti kõige olulisem rakendus panganduses on riskijuhtimine, sest hinnangute kohaselt moodustab kaupmeeste keskmine kahju pettuserünnakutest 1,5% nende aastasest tulust. JPMorgan hakkas kasutama AI tehnikaid ka varajase hoiatussüsteemi väljatöötamiseks, mis tuvastab pahavara, troojalased ja viirused. Väidetavalt tuvastab see tuvastamissüsteem kahtlase käitumise ammu enne, kui töötajatele pettusemeile tegelikult saadetakse.