Masinõpe on andmeanalüüsi meetod, mis automatiseerib analüütilise mudeli koostamist. See on tehisintellekti haru, mis põhineb ideel, et süsteemid saavad andmetest õppida ning see suudab tuvastada mustreid ja teha otsuseid vähema inimese sekkumisega.
Masinõpet kasutatakse laialdaselt Interneti-otsingumootorites, e-posti filtrites rämpsposti veebisaitide sorteerimiseks, pangatarkvaras ebatavaliste või rikutud tehingute tuvastamiseks ning seda kasutatakse paljudes telefonirakendustes, näiteks hääletuvastuses.
Sisukord
- Karjäär masinõppes?
- Populaarseimad masinõppeintervjuu küsimused ja vastused
- 1. Palun selgitage masinõpet, tehisintellekti ja süvaõpet?
- 2. Kui raske on masinõpe?
- 3. Kas saate selgitada tuumatrikki SVM-algoritmis?
- 4. Kas saate loetleda mõned populaarsed ristvalideerimise tehnikad?
- 5. Erinevused pakkimis- ja võimendusalgoritmide vahel?
- Masinõppe intervjuu küsimused ja vastused
- 6. Mis on SVM-i tuumad? Kas saate loetleda mõned populaarsed SVM-is kasutatavad tuumad?
- 7. Kas saate OOB-i viga selgitada?
- 8. Kas suudate K-Meansi ja KNN-i algoritme eristada?
- 9. Selgitage mõiste dispersiooni inflatsioonifaktori keskmine?
- 10. Selgitage SVM-i (Support Vector Machines) masinõppes?
- Masinõppe intervjuu küsimused ja vastused
- 11. Kas teha vahet juhendatud ja järelevalveta masinõppel?
- 12. Selgitage mõisteid täpsus ja meeldetuletus?
- 13. Kas teha vahet L1 ja L2 Regulariseerimise vahel?
- 14. Selgitage Fourier' teisendust?
- 15. Mis on F1 tulemus? Kuidas seda kasutada?
- Masinõppe intervjuu küsimused ja vastused
- 16. Kas eristada I ja II tüüpi viga?
- 17. Kas saate selgitada, kuidas ROC kõver töötab?
- 18. Kas teha vahet süvaõppel ja masinõppel?
- 19. Kas saate nimetada erinevaid masinõppe algoritme?
- Masinõppe intervjuu küsimused ja vastused
- 20. Mis on AI?
- Masinõppe intervjuu küsimused ja vastused
- 21. Kuidas valida andmestiku kallal töötamise ajal olulisi muutujaid?
- 22. Kas teha vahet põhjuslikkuse ja korrelatsiooni vahel?
- 23. Mis on overfitting?
- 24. Selgitage mõisteid standardhälve ja dispersioon?
- 25. Selgitage mitmekihilist Perceptroni ja Boltzmanni masinat?
- Masinõppe intervjuu küsimused ja vastused
- 26. Selgitage mõiste eelarvamus?
- 27. Nimeta masinõppe tüübid?
- 28. Kas teha vahet klassifikatsioonil ja regressioonil?
- 29. Mis on segadusmaatriks?
- 30. Kui teie andmekogumil on suur dispersioon, kuidas te sellega käituksite?
- Masinõppe intervjuu küsimused ja vastused
- 31. Kas teha vahet induktiivsel ja deduktiivsel õppimisel?
- 32. Selgitage rikutud väärtuste käsitlemist antud andmekogumis?
- 33. Kumb neist on olulisem mudeli täpsus või mudeli jõudlus?
- 34. Mis on aegrida?
- 35. Kas teha vahet entroopial ja teabe hankimisel?
- 36. Kas eristada stohhastilist gradiendi laskumist (SGD) ja gradiendi laskumist (GD)?
- 37. Kas teha vahet Gini lisandi ja entroopia vahel otsustuspuus?
- 38. Nimetage mõningaid otsustuspuude eeliseid ja puudusi?
- 39. Kas saate selgitada masinõppe ansambliõppe tehnikat?
- Masinõppe intervjuu küsimused ja vastused
- 40. Selgitage mõisteid Kollineaarsus ja Multikollineaarsus?
- 41. Kas eristada Random Forest ja Gradient Boosting masinaid?
- 42. Selgitage mõisteid Omavektorid ja Omaväärtused?
- 43. Kas saate selgitada assotsiatiivsete reeglite kaevandamist (ARM)?
- 44. Mis on A/B testimine?
- 45. Selgitage marginaliseerumist ja selle protsessi?
- Masinõppe intervjuu küsimused ja vastused
- 46. Mis on klastrivalim?
- 47. Selgitage mõistet 'Dimensioonilisuse needus'?
- 48. Kas saate nimetada mõned Pythonis kasutatavad teegid, mida kasutatakse andmeanalüüsi ja teaduslike arvutuste jaoks?
- 49. Mis on kõrvalekalded? Mainige meetodeid kõrvalekalletega toimetulemiseks?
- 50. Loetlege mõned populaarsed jaotuskõverad koos stsenaariumitega, kus te neid algoritmis kasutate?
- Masinõppe intervjuu küsimused ja vastused
- 51. Kas saate loetleda eeldused andmete täitmiseks enne lineaarse regressiooniga alustamist?
- 52. Selgitage mõiste dispersiooni inflatsiooniteguri keskmine?
- 53. Kas saate meile öelda, millal lineaarne regressioonisirge lõpetab pöörlemise või leiab optimaalse koha, kuhu see andmetele sobitub?
- 54. Kas saate meile öelda, millist masinõppe algoritmi nimetatakse laisaks õppijaks ja miks seda nii nimetatakse?
- 55. Kas saate meile öelda, mis võib olla probleem, kui konkreetse muutuja beetaväärtus varieerub igas alamhulgas liiga palju, kui regressiooni käitatakse andmestiku erinevatel alamhulkadel?
- 56. Kuidas valida klassifikaatorit koolituskomplekti andmete suuruse alusel?
- 57. Kas masinõppe mudelis eristada koolituskomplekti ja testikomplekte?
- 58. Selgitage valepositiivset ja valenegatiivset ning kuidas need on olulised?
- 59. Selgitage mõistet pooljärelevalvega masinõpe?
- 60. Kas saate meile öelda, millised on juhendatud masinõppe rakendused kaasaegsetes ettevõtetes?
- 61. Kas saate vahet teha induktiivsel masinõppel ja deduktiivsel masinõppel?
- 62. Mis on Random Forest masinõppes?
- 63. Selgitage kallutatuse ja dispersiooni vahelist kompromissi?
- 64. Selgitage otsustuspuude pügamist ja kuidas seda tehakse?
- 65. Kuidas vähendatud veaalgoritmid töötavad otsustuspuude pügamisel?
- 66. Selgitage mõistet otsustuspuu klassifikatsioon?
- 67. Selgitage logistilist regressiooni?
- 68. Nimetage mõni mõõtmelisuse vähendamise meetod?
- 69. Mis on soovitussüsteem?
- 70. Selgitage K lähima naabri algoritmi?
- 71. Arvestades antud pikka masinõppe algoritmide loendit ja andmekogumit, kuidas toidetakse meili rämpspostifiltreid sadade meilidega, mille puhul otsustate, millist neist kasutada?
- 72. Kas saate meile öelda, kuidas kujundada rämpspostifiltrit?
- 73. Kuidas saate vältida liigset istumist?
- 74. Selgitage terminit Selection bias in masinõppes?
- 75. Selgitage juhendatud õppe liike?
- 76. Mis kaduv gradient laskumine?
- 77. Kas saate nimetada pakutud meetodeid kaduva gradiendi probleemi lahendamiseks?
- 78. Kas teha vahet andmekaevandamisel ja masinõppel?
- 79. Nimetage masinõppe erinevad algoritmitehnikad?
- 80. Selgitage funktsiooni „Järelevalveta õppimine?
- 81. Selgitage masinõppe mõistet klassifikaator?
- 82. Mis on geneetilised algoritmid?
- 83. Kas oskate nimetada ala, kus saab kasutada mustrituvastust?
- 84. Selgitage mõistet Perceptron masinõppes?
- 85. Mis on isotooniline regressioon?
- 86. Mis on Bayesi võrgud?
- 87. Kas saate selgitada Bayesi loogikaprogrammi kahte komponenti?
- 88. Mis on inkrementaalõppe algoritm ansamblis?
- 89. Nimeta relatsioonilise hindamise tehnikate komponendid?
- 90. Kas saate selgitada ansambelmeetodi klassifikatsioonivea bias-variance dekompositsiooni?
- 91. Nimetage järjestikuse juhendatud õppe erinevad meetodid?
- 92. Mis on pakettstatistika õpe?
- 93. Kas oskate nimetada robootika ja infotöötluse valdkondi, kus tekib järjestikuse ennustamise probleem?
- 94. Nimetage erinevad kategooriad, mida saate järjestusõppe protsessi kategoriseerida?
- 95. Mis on järjestuse ennustamine?
- 96. Selgitage PAC õppimist?
- 97. Mis on PCA, KPCA ja ICA ning milleks neid kasutatakse?
- 98. Selgitage masinõppes mudeli loomise kolme etappi?
- 99. Selgitage mõistet hüpotees ML-is?
- 100. Selgitage masinõppe mõisteid Eepoch, Eentropy, Bbias ja Vvariance?
- Soovitatavad artiklid
Karjäär masinõppes?
Eeldatakse, et tehisintellekt loob 2022. aasta lõpuks umbes 4 miljardi dollari suuruse äriväärtuse. Üle kolmandiku ettevõtetest on juba alustanud kulutusi masinõppele ja andmeteadusele või kavatsevad seda teha lähiajal. .
Kui me räägime masinõppeinseneride töövõimalustest, siis perioodil 2015-2018 suurenes kogu maailmas sellele ametikohale pakutavate töökohtade arv enam kui 330%.
Masinõppega seotud töökohtadel saate teha head karjääri. Oleme välja toonud kõige sagedamini küsitud masinõppe intervjuu küsimused ja vastused. Vaadake kindlasti läbi kogu meie ajaveebi, et te ei jääks masinõppe intervjuu küsimustest ja vastustest ilma.
Populaarseimad masinõppeintervjuu küsimused ja vastused
1. Palun selgitage masinõpet, tehisintellekti ja süvaõpet?

Masinõpet määratletakse tehisintellekti alamhulgana ja see sisaldab tehnikaid, mis võimaldavad arvutitel andmete põhjal asju sorteerida ja tehisintellekti rakendusi pakkuda.
Tehisintellekt (AI) on arvutiteaduse haru, mis keskendub peamiselt nutikate masinate ehitamisele, mis suudavad täita teatud ülesandeid, mis nõuavad peamiselt inimese intelligentsust. See on ettevõtmine inimeste intelligentsust masinates kopeerida või simuleerida.
Süvaõpet saab määratleda kui tehisintellekti masinõppe algoritmide klassi, mis kasutab peamiselt mitut kihti, et kumulatiivselt eraldada kõrgema taseme funktsioonid antud töötlemata sisendist.
2. Kui raske on masinõpe?
Masinõpe on tohutu ja hõlmab paljusid asju. Seetõttu kulub masinõppe õppimiseks rohkem kui kuus kuud, kui kulutate päevas vähemalt 6–7 tundi. Kui teil on head praktilised matemaatilised ja analüüsioskused, piisab teile kuuest kuust.
3. Kas saate selgitada tuumatrikki SVM-algoritmis?
Kerneli trikk on meetod, mille puhul mittelineaarsed andmed projitseeritakse suuremasse dimensiooniruumi, et hõlbustada andmete klassifitseerimist, kus neid saab tasapinnaga lineaarselt jagada.
4. Kas saate loetleda mõned populaarsed ristvalideerimise tehnikad?
Mõned populaarsed ristvalideerimise tehnikad on loetletud allpool.
- Polünoomtuum
- Gaussi tuum
- Gaussi radiaalne baasfunktsioon (RBF)
- Laplace RBF kernel
- Hüperboolne puutuja tuum
- Sigmoidne tuum
- Esimest tüüpi kerneli Besseli funktsioon
- ANOVA radiaalpõhine tuum
- Tõelist positiivset määra saab määratleda kui positiivseteks prognoositud vaatluste osakaalu kõigist antud positiivsetest vaatlustest.
- Valepositiivsete määr on defineeritud kui nende vaatluste osakaal, mis on kõigist antud negatiivsetest tähelepanekutest valesti ennustatud positiivseteks.
- Otsustuspuud,
- Naiivne Bayes,
- Juhuslik mets
- Toetage vektormasinat
- K-lähim naaber,
- K-tähendab rühmitamist,
- Gaussi segu mudel,
- Varjatud Markovi mudel jne.
- Enne oluliste muutujate valimist peate eemaldama korrelatsioonimuutujad.
- Kasutage lineaarset regressiooni ja valige muutujad nende p väärtuste põhjal.
- Kasutage valikut edasi, astmelist valikut ja tagasisuunalist valikut.
- Kasutage Random Foresti, Xgboosti ja joonistage muutuva tähtsuse diagramm
- Kasutage Lasso regressiooni
- Peate valima n parimat funktsiooni, mõõtes saadaolevate funktsioonide kogumi teabekasu.
- Juhendatud õpe
- Järelevalveta õppimine
- Tugevdusõpe
- Eemaldage puuduvate väärtustega read.
- Looge veel üks ennustav mudel, et saaksite prognoosida puuduvad väärtused.
- Kasutage mudelit nii, et see võib sisaldada puuduvaid andmeid.
- Peate asendama puuduvad andmed koondatud väärtustega.
- Saate ennustada puuduvad väärtused.
- luua tundmatu kategooria
- Otsustuspuud nõuavad eeltöötluse ajal andmete ettevalmistamiseks vähem jõupingutusi võrreldes teiste algoritmidega.
- Otsustuspuu ei nõua andmete normaliseerimist.
- See ei nõua andmete skaleerimist.
- Andmetes puuduvad väärtused ei mõjuta otsustuspuu koostamise protsessi.
- Otsustuspuu mudelit on tehnilistele meeskondadele ja sidusrühmadele väga lihtne selgitada.
- NumPy
- SciPy
- pandad
- SciKit
- Matplotlib
- Seaborn
- Bokeh
- Ühemõõtmeline meetod
- Mitme muutujaga meetod
- Minkowski viga
- Lineaarne suhe
- Mitmemõõtmeline normaalsus
- Multikollineaarsus puudub või vähene
- Automaatne korrelatsioon puudub
- Homoskedastilisus
- Rasedustesti on positiivne, kui tegelikult te ei ole rase.
- Vähi sõeluuringu test on positiivne, kuid teil pole haigust.
- Sünnieelsed testid on Downi sündroomi suhtes positiivsed, kui teie lootel ei ole mingeid häireid.
- Teie süsteemi viirustarkvara tuvastab kahjutu programmi valesti pahatahtlikuna.
- Tervishoiu diagnoos
- Pettuste avastamine
- Meili rämpsposti tuvastamine
- Sentimentaalne analüüs
- Ülevalt alla (see liigub sõlmede vahel ja kärbib alampuid alustades juurest)
- Alt-üles mood (see algab lehtede sõlmedest)
- See arvestab pügamiseks iga sõlme.
- Kärpimine = alampuu eemaldamine sellest sõlmest, seejärel tehakse sellest leht ja määratakse sellele sõlmele peamine ühine klass.
- Sõlm eemaldatakse puust, kui saadud puu toimib algsest halvemini.
- Sõlmed eemaldatakse iteratiivselt, valides sõlme selliselt, et mille eemaldamine suurendab enamasti graafiku otsustuspuu täpsust.
- Pügamine jätkub seni, kuni edasine pügamine on kahjulik.
- See kasutab koolitust, testikomplekte ja valideerimist. See on tõhus lähenemisviis, kui saadaval on suur hulk andmeid.
- Kombineerides funktsioonid funktsioonitehnoloogiaga
- Kollineaarsete tunnuste eemaldamine
- kasutades algoritmilist mõõtmete vähendamist.
- Kui palju andmeid teil on ja kas see on pidev või kategooriline?
- Kas probleem on seotud klassifitseerimise, rühmitamise, assotsiatsiooni või regressiooniga?
- Kas see on eelmääratletud muutuja (sildiga), märgistamata või mõlema segu?
- Mis on peamine eesmärk?
- Meili rämpspostifiltrit toidetakse sadade kirjadega.
- Kõigil neil meilidel on silt: „rämpspost” või „pole rämpspost”.
- Järelevalvega masinõppe algoritm tuvastab seejärel rämpsposti märksõnade alusel, mis tüüpi meilid märgitakse rämpspostiks, näiteks loterii, raha puudumine, täielik tagasimakse jne.
- Järgmine kord, kui meil postkasti jõuab, kasutab rämpspostifilter statistilist analüüsi ja algoritme, nagu otsustuspuud ja SVM, et tuvastada, kui tõenäoline meil on rämpspost.
- Kui tõenäosus on suur, märgistatakse see rämpspostiks ja e-kiri ei jõua teie postkasti.
- Lähtudes iga mudeli täpsusest, kasutame pärast kõigi antud mudelite testimist kõrgeima töökindlusega algoritmi.
- Mitmetasandiline hierarhia
- Pikaajaline lühiajaline mälu
- Kiirem riistvara
- Jääknärvivõrgud (ResNets)
- Jätka
- Järelevalveta õppimine
- Õppimine pooleldi juhendamisel
- Transduktsioon
- Tugevdusõpe
- Õppima õppima
- Juhendatud õpe
- See peab leidma andmete klastrid.
- Leidke andmete madalamõõtmelised esitused
- Andmetes huvitavate juhiste leidmiseks
- Huvitavate koordinaatide ja korrelatsioonide arvutamiseks.
- Otsige uudseid vaatlusi või andmebaasi puhastamist.
- Otsuste puu
- Naiivne Bayesi klassifikaator
- K-Lähimad naabrid
- Toetage vektormasinaid
- Kunstlikud närvivõrgud
- Kõnetuvastus
- Statistika
- Mitteametlik otsimine
- Bioinformaatika
- Andmete kaevandamine
- Arvutinägemine
- Ühekihiline
- Mitmekihiline.
- Esimene komponent on loogiline: see sisaldab Bayesi klauslite komplekti, mis kajastab domeeni kvalitatiivset struktuuri.
- Teine komponent on kvantitatiivne: see kodeerib kvantitatiivset teavet domeeni kohta.
- Andmete hankimine
- Põhitõe omandamine
- Ristvalideerimise tehnika
- Päringu tüüp
- Hindamismõõdik
- Olulisuse test
- Korduvad lükandaknad
- Varjatud Markow mudelid
- Maksimaalne entroopia Markow mudelid
- Tingimuslikud juhuslikud väljad
- Graafiktrafode võrgud
- Lükandakna meetodid
- Struktureeritud ennustus
- Mudelipõhine tugevdusõpe
- Imitatsiooniõpe
- Jada genereerimine
- Järjestuste tuvastamine
- Järjestikune otsus
- Järjestuse ennustamine
- Mudeli ehitamine
- Mudeli testimine
- Mudeli rakendamine
5. Erinevused pakkimis- ja võimendusalgoritmide vahel?
Kotti pakkimine | Tugevdamine |
---|---|
See on meetod, mis ühendab sama tüüpi ennustused. | See on meetod, mis ühendab erinevat tüüpi ennustusi. |
See vähendab dispersiooni, mitte eelarvamusi | See vähendab kallutatust, mitte dispersiooni. |
Iga mudel saab võrdse kaalu | Mudelid kaalutakse jõudluse alusel. |
Masinõppe intervjuu küsimused ja vastused
6. Mis on SVM-i tuumad? Kas saate loetleda mõned populaarsed SVM-is kasutatavad tuumad?
Tuuma kasutatakse põhiliselt matemaatiliste funktsioonide seadistamiseks, mida kasutatakse tugivektori masinas, pakkudes andmetega manipuleerimise akent. Kerneli funktsiooni kasutatakse treeningandmete teisendamiseks nii, et mittelineaarne otsustuspind muudetakse lineaarseks võrrandiks suuremas arvus mõõtmetes.
Mõned SVM-is kasutatavad populaarsed tuumad on järgmised:
7. Kas saate OOB-i viga selgitada?
Kotist väljas olev viga, mida nimetatakse OBB veaks, mida tuntakse ka kui kotist väljas olevat hinnangut, on meetod juhuslike metsade, võimendatud otsustuspuude ennustusvea mõõtmiseks. Bagging kasutab põhiliselt alamproovimist koos asendusega, et luua koolitusnäidised, et mudel saaks neist õppida.
8. Kas suudate K-Meansi ja KNN-i algoritme eristada?
K-tähendab | KNN algoritmid |
---|---|
See on järelevalveta masinõpe. | See on juhendatud masinõpe. |
See on klastrite masinõppe algoritm. | See on klassifitseerimise või regressiooni masinõppe algoritm. |
Selle jõudlus on aeglane. | See toimib palju paremini. |
See on innukas õppija. | See on laisk õppija. |
9. Selgitage mõiste dispersiooni inflatsioonifaktori keskmine?
Dispersiooni inflatsioonitegur, mida tuntakse kui VIF, on antud mitme regressioonimuutujate komplekti multikollineaarsuse mõõt. Siinne suhe arvutatakse iga sõltumatu muutuja jaoks. Kõrge VIF tähendab, et seotud sõltumatu muutuja on enamasti kollineaarne mudeli teiste muutujatega.
10. Selgitage SVM-i (Support Vector Machines) masinõppes?
Support Vector Machine, tuntud kui SVM, on üks kõige sagedamini kasutatavaid juhendatud õppimise algoritme, mida kasutatakse peamiselt klassifitseerimise ja regressiooniprobleemide jaoks. Seda kasutatakse peamiselt masinõppe klassifikatsiooniprobleemide lahendamiseks.
Vaata ka 100 parimat võimalikku intervjuuküsimust ja vastustSVM-algoritmi põhieesmärk on luua parim otsustuspiir, mis eraldab n-mõõtmelise ruumi klassideks, et saaks edaspidi hõlpsasti uue saadud andmepunkti õigesse kategooriasse paigutada.
Masinõppe intervjuu küsimused ja vastused
11. Kas teha vahet juhendatud ja järelevalveta masinõppel?
Järelevalvega mudel | Järelevalveta mudel |
---|---|
Siin õpib algoritm märgistatud andmekogumil, | Siin pakub see märgistamata andmeid. |
Siin peavad mudelid leidma vastendusfunktsiooni, mida kasutatakse sisendmuutuja (X) vastendamiseks väljundmuutujaga (Y). | Juhendajata õppimise peamine eesmärk on leida antud sisendandmetest struktuur ja mustrid. |
12. Selgitage mõisteid täpsus ja meeldetuletus?
Täpsus, tuntud ka kui positiivne ennustav väärtus, on määratletud kui asjakohaste eksemplaride osa hangitud eksemplaride hulgas.
Täpsus = TP/TP+FP
Kus TP on tõeliselt positiivne
FP id Valepositiivne
Tagasikutsumine, Tuntud ka kui tundlikkus, määratletakse kui osa asjakohastest allalaaditud juhtudest.
Meenuta = TP/TP+FP.
Kus TP on tõeliselt positiivne
FP on valepositiivne.
13. Kas teha vahet L1 ja L2 Regulariseerimise vahel?
L1 Regulariseerimine | L2 Regulariseerimine |
---|---|
Regressioonimudelit, mis kasutab L1 reguleerimisprotsessi, nimetatakse Lasso regressiooniks. | Regressioonimudelit, mis kasutab L1 reguleerimisprotsessi, nimetatakse Ridge'i regressiooniks. |
Lasso regressioon lisab kahjufunktsioonile trahviliikmena koefitsiendi suuruse absoluutväärtuse. | Ridge regressioon lisab koefitsiendi ruudu suuruse trahviliikmena kahjufunktsioonile. |
See püüab hinnata andmete mediaani. | See püüab hinnata andmete keskmist. |
14. Selgitage Fourier' teisendust?
Fourier' teisendus on viis millegi jagamiseks siinuslainete hunnikuks. Matemaatika mõttes on Fourier' teisendus protsess, mis suudab signaali teisendada selle vastavateks koostisosadeks ja sagedusteks. Fourier' teisendust kasutatakse mitte ainult signaali-, raadio-, akustilises jne.
15. Mis on F1 tulemus? Kuidas seda kasutada?
F1-skoor ühendab nii klassifikaatori täpsuse kui ka meeldetuletuse harmoonilise keskmise võtmisega üheks meetriks. Seda kasutatakse kahe klassifikaatori jõudluse võrdlemiseks. Näiteks klassifikaatoril X on suurem tagasikutsumine ja klassifikaatoril Y suurem täpsus. Nüüd kasutatakse mõlema klassifikaatori jaoks arvutatud F1-skoore, et ennustada, kumb annab paremaid tulemusi.
F1 skoori saab arvutada järgmiselt
2(P*R)/(P+R)
Kus P on täpsus.
R on klassifikatsioonimudeli tagasikutsumine.
Masinõppe intervjuu küsimused ja vastused
16. Kas eristada I ja II tüüpi viga?
I tüüpi viga | II tüüpi viga |
---|---|
See on samaväärne valepositiivsusega. | See on samaväärne valenegatiivsega |
See viitab hüpoteesi mitteaktsepteerimisele | See viitab hüpoteesi aktsepteerimisele |
Tagasilükkamine võib toimuda isegi volitatud vaste korral. | Aktsepteerimine võib toimuda isegi volitamata vastega. |
17. Kas saate selgitada, kuidas ROC kõver töötab?
ROC kõver on kujutatud graafiliselt, joonistades tõelise positiivse määra (TPR) ja FPR (valepositiivsed määrad). Kus
(TP/(TP + FN))
(FP/(TN + FP))
18. Kas teha vahet süvaõppel ja masinõppel?
Sügav õppimine | Masinõpe |
---|---|
See on masinõppe alamhulk | See on süvaõppe superkomplekt. |
See lahendab keerulised probleemid. | Seda kasutatakse uute asjade õppimiseks. |
See on masinõppe evolutsioon. | See on AI areng. |
Siin on algoritmid andmeanalüüsis suures osas ise kujutatud | Algoritmid tuvastavad andmeanalüütikud. |
19. Kas saate nimetada erinevaid masinõppe algoritme?
Erinevad masinõppe algoritmid on loetletud allpool.
Masinõppe intervjuu küsimused ja vastused
20. Mis on AI?

AI (tehisintellekt) viitab inimese intelligentsuse simuleerimisele masinates, mis on programmeeritud peegeldama sarnaselt inimestega ja jäljendama nende tegevusi.
Näited: näotuvastus ja -tuvastus, Google Maps ja
Sõiduteenuse rakendused, e-maksed.
Masinõppe intervjuu küsimused ja vastused
21. Kuidas valida andmestiku kallal töötamise ajal olulisi muutujaid?
22. Kas teha vahet põhjuslikkuse ja korrelatsiooni vahel?
The Põhjuslikkus kehtib selgesõnaliselt juhtudel, kui tegevus A põhjustab tegevuse B tulemuse.
Korrelatsioon võib lihtsalt defineerida kui suhet. Kus A tegevused võivad olla seotud tegevusega B. kuid siin pole vaja, et üks sündmus põhjustaks teise sündmuse toimumist.
23. Mis on liigne paigaldamine?
Ülesobitamine on teatud tüüpi modelleerimisviga, mille tulemuseks on suutmatus ennustada ega arvata tulevasi vaatlusi tõhusalt ega sobitada lisaandmeid juba olemasolevasse mudelisse.
24. Selgitage mõisteid standardhälve ja dispersioon?
TO standardhälve on defineeritud kui arv, mis määrab väärtuste hajutamise. Madal standardhälve näitab, et enamik numbreid on keskmise väärtuse lähedal. Kõrgem standardhälve tähendab, et väärtused on hajutatud, seda laiemas vahemikus.
Dispersioon masinõppes on teatud tüüpi tõrge, mis tuleneb mudeli tundlikkusest antud treeningkomplekti väikeste kõikumiste suhtes.
25. Selgitage mitmekihilist Perceptroni ja Boltzmanni masinat?
Mitmekihiline pertseptron (MLP) on määratletud kui tehisnärvivõrkude klass, mis suudab antud sisendite hulgast genereerida väljundite komplekti. MLP koosneb mitmest sisendsõlmede kihist, mis on ühendatud suunatud graafikuna sisend- ja väljundkihtide vahel.
Peamine eesmärk Boltzmanni masin on antud probleemi lahenduse optimeerimine. Seda kasutatakse peamiselt selle konkreetse probleemiga seotud kaalude ja koguste optimeerimiseks.
Masinõppe intervjuu küsimused ja vastused
26. Selgitage mõiste eelarvamus?
Andmete kallutatust masinõppes defineeritakse kui veatüüpi, mille puhul antud andmestiku teatud elemendid on kaalutud rohkem kui teised. Kallutatud andmekogum ei kajasta täpselt mudeli kasutusjuhtu ning selle tulemuseks on madal täpsustase ja analüüsivigu.
27. Nimeta masinõppe tüübid?
Masinõppe tüübid on loetletud allpool.
28. Kas teha vahet klassifikatsioonil ja regressioonil?
Klassifikatsioon | Regressioon |
---|---|
See on sildi ennustamine | See on koguse ennustamine |
Siin on andmed märgistatud ühes või mitmes klassis. | Siin peate kogust pidevalt ennustama. |
See võib ennustada pidevat väärtust. | See võib ennustada diskreetset väärtust. |
Seda saab hinnata täpsuse abil. | Seda saab hinnata keskmise ruudu vea abil. |
29. Mis on segadusmaatriks?
Masinõppe valdkonnas on a segaduse maatriks nimetatakse ka veamaatriksiks, on määratletud kui spetsiifiline tabelipaigutus, mis võimaldab kasutajal visualiseerida algoritmi, peamiselt juhendatud õppimise, toimivust.

30. Kui teie andmekogumil on suur dispersioon, kuidas te sellega käituksite?
Suure dispersiooniga andmekogumite puhul saame kasutada pakkimisalgoritmi. Pakkimisalgoritm jagab andmed erinevatesse alamrühmadesse juhuslike andmete põhjal kopeeritud valimiga. Kui andmed on jagatud treeningalgoritmi abil, saab juhuslikke andmeid kasutada reeglite loomiseks. Seejärel kasutame küsitlustehnikat, et koguda kõik mudeli prognoositavad tulemused.
Masinõppe intervjuu küsimused ja vastused
31. Kas teha vahet induktiivsel ja deduktiivsel õppimisel?
Induktiivne õpe | Deduktiivne õpe |
---|---|
Selle eesmärk on arendada teooriat. | Selle eesmärk on testida olemasolevat teooriat. |
See liigub konkreetsetelt tähelepanekutelt laiaulatuslike üldistuste juurde | Kui teooriat pole, ei saa te läbi viia deduktiivseid uuringuid. |
See koosneb kolmest etapist.VaatlusJälgige mustrit Töötage välja teooria | See koosneb neljast etapist: alustage olemasolevast teooriast. Sõnastage olemasoleval teoorial põhinev hüpotees. Koguge andmeid hüpoteesi kontrollimiseks. Analüüsige tulemusi |
32. Selgitage rikutud väärtuste käsitlemist antud andmekogumis?
Allpool on toodud võimalused puuduvate andmete käsitlemiseks?
33. Kumb neist on olulisem mudeli täpsus või mudeli jõudlus?
Mudeli täpsus peetakse masinakeele / AI mudeli oluliseks omaduseks. Iga kord, kui arutleme mudeli toimivuse üle, teeme esmalt selgeks, kas see on mudeli tulemuslikkuse või mudeli koolituse tulemuslikkus.
Mudeli jõudlus on täiustatud hajutatud andmetöötluse ja antud hinnatud varade paralleelstamise abil, kuid mudeli koolitusprotsessi käigus peame täpsust hoolikalt suurendama.
34. Mis on aegrida?
Masinõppe aegrida määratletakse juhuslike muutujate kogumina, mis on järjestatud aja järgi. Aegridu uuritakse nähtuse tõlgendamiseks, trendi komponentide, tsüklilisuse tuvastamiseks ja selle tulevaste väärtuste ennustamiseks.
35. Kas teha vahet entroopial ja teabe hankimisel?
The Teabe kogumine on defineeritud kui teabe hulk, mis on saadud signaali või juhusliku muutuja kohta teise juhusliku muutuja vaatlemisel.
Entroopia võib defineerida kui keskmist kiirust, millega stohhastiline andmeallikas toodab teavet, või võib seda defineerida kui juhusliku suurusega seotud määramatuse mõõdet.
36. Kas eristada stohhastilist gradiendi laskumist (SGD) ja gradiendi laskumist (GD)?
Partii gradiendi laskumine on kaasatud iga sammu täieliku treeningkomplekti arvutamisse, mille tulemuseks on väga aeglane protsess väga suurte treeningandmete puhul. Seetõttu muutub Batch GD tegemine väga kulukaks. Siiski on see suurepärane suhteliselt sujuvate veakollektorite jaoks. Lisaks on see funktsioonide arvuga hästi mastaapne.
Stohhastilise gradiendi laskumine proovib lahendada Batch Gradient'i laskumise peamist probleemi, milleks on kogu treeningandmete kasutamine gradientide arvutamiseks iga sammuna. SGD on oma olemuselt stohhastiline, mis tähendab, et see kogub igal sammul mõned juhuslikud treeningandmete eksemplarid ja seejärel arvutab gradiendi, muutes selle kiiremaks, kuna ühe pildiga manipuleerimiseks on väga vähe andmeid.
Partii gradiendi laskumine | Stohhastilise gradiendi laskumine |
---|---|
See arvutab gradiendi, kasutades kogu koolituse näidist. | See arvutab gradiendi ühe koolitusnäidise abil. |
Seda ei saa soovitada suurte treeningnäidiste jaoks. | Seda saab soovitada suurte koolitusnäidiste jaoks. |
See on oma olemuselt deterministlik. | See on oma olemuselt keerukas. |
37. Kas teha vahet Gini lisandi ja entroopia vahel otsustuspuus?
Gini | Entroopia |
---|---|
Sellel on väärtused vahemikus [0, 0,5] | Sellel on väärtused vahemikus [0, 1] |
See on keerulisem. | See ei ole keeruline. |
Selle mõõtmine on tõenäosus, et juhuslik valim klassifitseeritakse õigesti. | See on mõõtmine teabe puudumise arvutamiseks, |
38 . Kas mainida mõningaid otsustuspuude eeliseid ja puudusi?

Otsustuspuu eelised:
39. Kas saate selgitada masinõppe ansambliõppe tehnikat?
Ansamblimeetodid on meetodid, mida kasutatakse mitme mudeli loomiseks ja nende kombineerimiseks, et saada paremaid tulemusi. Ansamblimeetodid annavad tavaliselt täpsemaid lahendusi kui üks mudel.
sisse Ansambliõpe , jagame treeningandmete komplekti mitmeks alamhulgaks, kus iga alamhulka kasutatakse seejärel eraldi mudeli koostamiseks. Kui mudelid on koolitatud, kombineeritakse need tulemuse ennustamiseks nii, et väljundi dispersioon väheneb.
Masinõppe intervjuu küsimused ja vastused
40. Selgitage mõisteid Kollineaarsus ja Multikollineaarsus?
Multikollineaarsus tekib siis, kui mitu sõltumatut muutujat on regressioonimudelis üksteisega tugevas korrelatsioonis, mis tähendab, et sõltumatut muutujat saab ennustada regressioonimudeli teisest sõltumatust muutujast.
Kollineaarsus esineb peamiselt siis, kui kahel mitmekordse regressiooni ennustava muutuja vahel on mingi korrelatsioon.

41. Kas eristada Random Forest ja Gradient Boosting masinaid?
Nagu juhuslikud metsad, on ka gradiendi suurendamine ka otsustuspuude kogum. Kaks peamist erinevust on järgmised:
42. Selgitage mõisteid Omavektorid ja Omaväärtused?
Omavektorid on ühikvektorid, mis tähendab, et nende pikkus või suurus on 1,0. Neid nimetatakse parempoolseteks vektoriteks, mis tähendab veeruvektorit.
Omaväärtused on koefitsiendid, mida rakendatakse omavektoritele, mis omakorda annavad vektoritele nende pikkuse või suuruse.

43. Kas saate selgitada assotsiatiivsete reeglite kaevandamist (ARM)?
Ühingureeglite kaevandamine (ARM) eesmärk on välja selgitada ühenduse reeglid, mis vastavad andmebaasi eelnevalt määratletud minimaalsele toele ja usaldusväärsusele. AMO-d kasutatakse peamiselt seostamisreeglite arvu vähendamiseks uute treeningfunktsioonidega, mis võivad sisaldada sagedasi reegleid.
44. Mis on A/B testimine?
A/B testimine on defineeritud kui põhiline randomiseeritud kontrollkatse. Seda kasutatakse muutuja kahe versiooni võrdlemiseks, et välja selgitada, milline neist toimib paremini kontrollitud keskkonnas.
A/B testimist saab kõige paremini kasutada kahe mudeli võrdlemiseks, et kontrollida, milline toode on kliendile kõige paremini soovitatud.
45. Selgitage marginaliseerumist ja selle protsessi?
Marginaliseerimine on meetod, mis nõuab ühe muutuja võimalike väärtuste summeerimist, et määrata teise muutuja marginaalne panus.
P(X=x) = ∑YP(X=x,Y)
Masinõppe intervjuu küsimused ja vastused
46. Mis on klastrivalim?

Kobarvalim on määratletud kui proovivõtumeetodi tüüp. Klastrite valimiga jagavad teadlased tavaliselt populatsiooni eraldi rühmadesse või komplektidesse, mida nimetatakse klastriteks. Seejärel valitakse populatsioonist juhuslik valim klastreid. Seejärel analüüsib uurija kogutud valimi klastrite andmeid.
47. Selgitage mõistet 'Dimensioonilisuse needus'?
Mõõtmelisuse needus viitab põhimõtteliselt vea suurenemisele koos tunnuste arvu suurenemisega. Seda võib viidata asjaolule, et algoritme on jõuline projekteerida suurtes mõõtmetes ja nende tööaeg on sageli mõõtmetes eksponentsiaalne.
48. Kas saate nimetada mõned Pythonis kasutatavad teegid, mida kasutatakse andmeanalüüsi ja teaduslike arvutuste jaoks?
49. Mis on kõrvalekalded? Mainige meetodeid kõrvalekalletega toimetulemiseks?
Kõrvalväärtust saab defineerida kui objekti, mis erineb oluliselt teistest objektidest. Need võivad olla põhjustatud täitmisveadest.
Kolm peamist meetodit kõrvalekallete käsitlemiseks on järgmised:
50. Loetlege mõned populaarsed jaotuskõverad koos stsenaariumitega, kus te neid algoritmis kasutate?
Kõige populaarsemad jaotuskõverad on:
Ühtlane jaotus võib defineerida kui tõenäosusjaotust, millel on konstantne tõenäosus. Näide: ühe täringu viskamine, kuna sellel on mitu tulemust.
Binoomjaotus on defineeritud kui tõenäosus, millel on ainult kaks võimalikku tulemust. Näide: mündiviskamine. Tulemuseks on kas pead või sabad.
Normaaljaotus määrab, kuidas muutuja väärtused jaotatakse. Näide: õpilaste pikkus klassiruumis.
Kalade jaotus aitab ennustada konkreetsete sündmuste tõenäosust, kui teate, kui sageli see sündmus on aset leidnud.
Eksponentjaotus puudutab peamiselt aega, mis kulub konkreetse sündmuse toimumiseni. Näide: kui kaua võib auto aku vastu pidada kuudes.
Masinõppe intervjuu küsimused ja vastused
51. Kas saate loetleda eeldused andmete täitmiseks enne lineaarse regressiooniga alustamist?
Eeldused, mida tuleb täita, on järgmised:
52. Selgitage mõiste dispersiooni inflatsiooniteguri keskmine?
Dispersiooni inflatsioonitegur, mis on VIF, on defineeritud kui multikollineaarsuse suuruse mõõt mitme regressioonimuutuja komplektis.
Matemaatiliselt on regressioonimudeli muutuja dispersiooni inflatsioonitegur võrdne mudeli lõpliku dispersiooni ja seda üksikut sõltumatut muutujat sisaldava mudeli dispersiooni suhtega.
See suhe arvutatakse iga sõltumatu muutuja jaoks. Kõrge VIF näitab, et seotud sõltumatu muutuja on väga kollineaarne mudeli teiste muutujatega.
53. Kas saate meile öelda, millal lineaarne regressioonisirge lõpetab pöörlemise või leiab optimaalse koha, kuhu see andmetele sobitub?
Koht, kus RS-ruudu suurim väärtus leitakse, on koht, kus joon peatub. RSquared esindab tavaliselt dispersiooni suurust, mille hõivab virtuaalne lineaarne regressioonijoon w.r.t andmestiku jäädvustatud kogu dispersioonist.
54. Kas saate meile öelda, millist masinõppe algoritmi nimetatakse laisaks õppijaks ja miks seda nii nimetatakse?
KNN masinõppe algoritmi nimetatakse laisaks õppijaks. K-NN on määratletud kui laisk õppija, kuna ta ei õpi antud treeningandmetest masinõpitud väärtusi ega muutujaid, vaid arvutab dünaamiliselt distantsi iga kord, kui soovib klassifitseerida. Seetõttu jätab see selle asemel treeninguandmestiku meelde.
55. Kas saate meile öelda, mis võib olla probleem, kui konkreetse muutuja beetaväärtus varieerub igas alamhulgas liiga palju, kui regressiooni käitatakse andmestiku erinevatel alamhulkadel?
Iga alamhulga beetaväärtuste variatsioonid viitavad sellele, et andmestik on heterogeenne. Selle probleemi lahendamiseks kasutame antud andmestiku iga rühmitatud alamhulga jaoks erinevat mudelit või kasutame mitteparameetrilist mudelit, näiteks otsustuspuud.
56. Kuidas valida klassifikaatorit koolituskomplekti andmete suuruse alusel?
Näiteks kui treeningkomplekt on väikese suurusega, suure kallutatusega või väikese dispersiooniga mudelid, kipuvad Naive Bayes paremini hakkama saama, kuna neil on väiksem tõenäosus üle istuda.
Kui treeningkomplekt on suur, kipuvad väikese kallutatuse või suure dispersiooniga mudelid, näiteks logistiline regressioon, paremini toimima, kuna need võivad peegeldada keerulisemaid seoseid.
57. Kas masinõppe mudelis eristada koolituskomplekti ja testikomplekte?
Treeningkomplekt | Testkomplekt |
---|---|
70% koguandmetest võetakse treeningandmete kogumina. | Ülejäänud 30% võetakse testimise andmekogumina. |
Seda rakendatakse mudeli koostamiseks. | Seda kasutatakse ehitatud mudeli kinnitamiseks. |
Need on märgistatud andmed, mida kasutatakse mudeli koolitamiseks. | Tavaliselt testime ilma märgistatud andmeteta ja seejärel kontrollime tulemusi siltide abil. |
58. Selgitage valepositiivset ja valenegatiivset ning kuidas need on olulised?
TO valepositiivne on kontseptsioon, mille puhul saate antud testi kohta positiivse tulemuse, kui tegelikult oleksite pidanud saama negatiivse tulemuse. Seda nimetatakse ka valehäireks või valepositiivseks veaks. Seda kasutatakse peamiselt meditsiinivaldkonnas, kuid seda saab kasutada ka tarkvara testimisel.
Näited valepositiivsetest kohtadest:
TO vale negatiivne on määratletud, kui negatiivne testitulemus on vale. Lihtsamalt öeldes saate negatiivse testitulemuse, kus oleks pidanud saama positiivse testitulemuse.
Näiteks kaaluge rasedustesti tegemist ja teie test on negatiivne (mitte rase). Kuid tegelikult olete rase.
Valenegatiivsed rasedustesti tulemused liiga varajase testi tegemise, lahjendatud uriini kasutamise või tulemuste õigeaegse kontrollimise tõttu. Peaaegu igal meditsiinilisel testil on valenegatiivse tulemuse oht.
59. Selgitage mõistet pooljärelevalvega masinõpe?
Pooljärelevalvega õpe on defineeritud kui masinõppe lähenemisviis, mis ühendab koolitusprotsessi ajal väiksema hulga märgistatud andmeid suure hulga märgistamata andmetega. See jääb juhendamata õppimise ja juhendatud õppimise vahele.
60. Kas saate meile öelda, millised on juhendatud masinõppe rakendused kaasaegsetes ettevõtetes?
61. Kas saate vahet teha induktiivsel masinõppel ja deduktiivsel masinõppel?
Induktiivne masinõpe | Deduktiivne masinõpe |
---|---|
A ⋀ B ⊢ A → B (induktsioon) | A ⋀ (A –> B) ⊢ B (mahaarvamine) |
Ta vaatleb ja õpib juhtumite kogumit ning teeb seejärel järelduse. | Ta teeb kõigepealt järelduse ja seejärel töötab selle põhjal eelmise otsuse põhjal. |
See on statistiline masinõpe nagu KNN või SVM, | Masinõppe algoritm deduktiivseks arutluseks otsustuspuu abil. |
62. Mis on Random Forest masinõppes?
Juhuslikku metsa saab määratleda kui juhendatud õppealgoritmi, mida kasutatakse klassifitseerimiseks ja regressiooniks. Sarnaselt loob juhuslik metsaalgoritm andmevalimitele otsustuspuud, seejärel saab igast valimist ennustuse ja valib lõpuks hääletamise teel välja parima.
63. Selgitage kallutatuse ja dispersiooni vahelist kompromissi?
Eelarvamus saab määratleda kui mudelis tehtud eeldused, mis muudavad sihtfunktsiooni hõlpsaks ligikaudseks.
Dispersioon on defineeritud kui summa, mida sihtfunktsiooni hinnang erinevaid treeningandmeid arvestades muutub.
The kompromiss on defineeritud kui pinge nihkest põhjustatud vea ja dispersiooni vahel.
64. Selgitage otsustuspuude pügamist ja kuidas seda tehakse?
Kärpimine on masinõppe- ja otsingualgoritmide andmete tihendamise protsess, mis võib vähendada otsustuspuude suurust, eemaldades puu teatud osad, mis ei ole eksemplaride klassifitseerimiseks kriitilised ja mittevajalikud. Liiga suur puu võib treeningandmeid üle sobitada ja see on uutele näidistele halvasti üldistav.
Kärpimine võib toimuda järgmiselt.
Oleme vähendanud otsustuspuude kärpimise veaalgoritmi.
65. Kuidas vähendatud veaalgoritmid töötavad otsustuspuude pügamisel?
Vähendatud vea algoritm töötab järgmiselt:
66. Selgitage mõistet otsustuspuu klassifikatsioon?
Otsustuspuu loob klassifikatsioonimudeleid puustruktuurina, kusjuures andmestikud jagatakse otsustuspuu väljatöötamise ajal väiksemateks alamhulkadeks; Põhimõtteliselt on see puutaoline viis, mille oksad ja sõlmed on määratletud. Otsustuspuud töötlevad nii kategoorilisi kui ka arvulisi andmeid.
67. Selgitage logistilist regressiooni?
Logistiline regressioonanalüüs on meetod, mida kasutatakse sõltumatute muutujate seose uurimiseks ühe dihhotoomse sõltuva muutujaga. See on vastupidine lineaarsele regressioonianalüüsile, kus sõltuv muutuja on pidev muutuja.
Iga kord, kui logistilise regressiooni väljund on 0 või 1, mille läviväärtus on 0,5. Iga väärtus, mis on suurem kui 0,5, loetakse 1-ks ja mis tahes punkt, mis on väiksem kui 0,5, loetakse 0-ks.
68. Nimetage mõni mõõtmelisuse vähendamise meetod?
Mõned mõõtmete vähendamise meetodid on toodud allpool:
69. Mis on soovitussüsteem?
Soovitussüsteemid koguvad peamiselt klientide andmeid ja analüüsivad neid automaatselt, et luua klientidele kohandatud soovitusi. Need süsteemid toetuvad peamiselt kaudsetele andmetele, nagu sirvimisajalugu ja hiljutised ostud, ning selgesõnalistele andmetele, nagu kliendi antud hinnangud.

70. Selgitage K lähima naabri algoritmi?
K-Lähim naaber on lihtsaim masinõppe algoritm, mis põhineb juhendatud õppe tehnikal. See eeldab uue juhtumi või andmete ja saadaolevate juhtumite sarnasust ning paigutab uue juhtumi kategooriasse, mis on sarnane olemasolevate kategooriatega.
Näiteks on meil pilt olendist, mis näeb välja sarnane kassi ja koera omaga, kuid me tahame teada, kas see on kass või koer. Selle tuvastamiseks saame kasutada KNN-i algoritmi, kuna see töötab sarnasuse alusel. KNN-i mudel leiab uue andmestiku sarnasused kasside ja koerte piltidega ning see põhineb sarnastel omadustel; see paneb selle kassi või koera kategooriasse.
71. Arvestades antud pikka masinõppe algoritmide loendit ja andmekogumit, kuidas e-kirjade rämpspostifiltreid toidetakse sadade kirjadega otsustad, millist kasutada?
Algoritmi valimine sõltub alltoodud küsimustest:
Ülaltoodud küsimuste põhjal tuleb valida õige algoritm, mis vastab nende nõudmistele.
72. Kas saate meile öelda, kuidas kujundada rämpspostifiltrit?
73. Kuidas saate vältida liigset istumist?
Ülepaigutamist saab vältida, järgides järgmisi samme:
74. Selgitage terminit Selection bias in masinõppes?
Valiku kallutatus toimub siis, kui andmekogumi näited on valitud nii, et see ei peegelda nende tegelikku levikut. Valiku kallutatus võib esineda mitmel erineval kujul.
Näide: mudelit koolitatakse selliselt, et ta ennustaks uue toote tulevast müüki toote ostnud klientide valimiga tehtud telefoniküsitluste põhjal. Tarbijaid, kes valisid hoopis konkureeriva toote ostmise, ei küsitletud ja seetõttu ei olnud see inimeste hulk koolitusandmetes esindatud.
Näide. Mudelit koolitatakse selliselt, et ennustada uue toote tulevast müüki, tuginedes telefoniküsitlustele, mis viidi läbi toote ostnud klientide valimiga ja konkureeriva toote ostnud klientide valimiga. Konkureeriva toote ostnud kliendid keeldusid küsitlusest 80% sagedamini ning nende andmed olid valimis alaesindatud.
Näide: mudel, mis on koolitatud ennustama uue toote tulevast müüki, tuginedes telefoniküsitlustele, mis viidi läbi toote ostnud klientide valimi ja konkureeriva toote ostnud klientide valimiga. Juhusliku klientide sihtimise asemel valis küsitleja esimesed 200 nende meilile vastanud tarbijat, kes võisid olla toote suhtes innukad kui keskmised ostjad.
75. Selgitage juhendatud õppe liike?
Juhendatud õpet on kahte tüüpi, nimelt
76. Mis kaduv gradient laskumine?
Masinõppes puutume kokku kaduva gradiendi probleemiga, kui treenime närvivõrke gradiendipõhiste meetoditega, nagu tagasilevi. See probleem raskendab antud võrgu varasemate kihtide parameetrite häälestamist ja õppimist.
Kaduvate gradientide probleemi võib võtta kui üht näidet ebastabiilsest käitumisest, millega võime sügava närvivõrgu treenimisel kokku puutuda.
See kirjeldab olukorda, kus sügav mitmekihiline feed-forward võrk või korduv närvivõrk ei suuda levitada kasulikku gradiendi teavet mudeli antud väljundotsast tagasi mudeli sisendotsa lähedal asuvatesse kihtidesse.
77. Kas saate nimetada pakutud meetodeid kaduva gradiendi probleemi lahendamiseks?
Kaduvate gradiendiprobleemide ületamiseks pakutud meetodid on järgmised:
78. Tee vahet Andmekaevandamine ja masinõpe?
Andmete kaevandamine | Masinõpe |
---|---|
See eraldab suurest andmehulgast kasulikku teavet. | See tutvustab algoritme nii andmete kui ka varasemate kogemuste põhjal. |
Seda kasutatakse andmevoo mõistmiseks. | See õpetab arvuteid andmevoogudest õppima ja mõistma. |
Sellel on tohutud andmebaasid struktureerimata andmetega. | Sellel on nii olemasolevad andmed kui ka algoritmid. |
See nõuab inimese sekkumist sellesse. | Pärast projekteerimist pole vaja inimlikku pingutust |
Mudelid töötatakse välja andmekaeve tehnikat kasutades | masinõppe algoritmi saab kasutada otsustuspuus, närvivõrkudes ja mõnes muus tehisintellekti osades |
See on rohkem uurimistöö, kasutades selliseid meetodeid nagu masinõpe. | See on iseõppinud ja koolitab süsteemi intelligentseid ülesandeid tegema. |
79. Nimetage masinõppe erinevad algoritmitehnikad?
Masinõppe erinevad algoritmitehnikad on loetletud allpool.
80. Selgitage 'Järelevalveta õppimise' funktsiooni?
81. Selgitage masinõppe mõistet klassifikaator?
Masinõppe klassifikaator on defineeritud kui algoritm, mis liigitab andmed automaatselt ühte või mitmesse klassi rühma. Üks levinumaid näiteid on meiliklassifikaator, mis suudab e-kirju skannida, et filtreerida need antud klassisiltide järgi: rämpspost või mitte rämpspost.
Meil on viit tüüpi klassifitseerimisalgoritme, nimelt
82. Mis on geneetilised algoritmid ?
Geneetilised algoritmid on defineeritud kui stohhastilised otsingualgoritmid, mis võivad toimida võimalike lahenduste populatsioonile. Tehisintellektis kasutatakse geneetilisi algoritme peamiselt võimalike lahenduste otsimiseks, et leida üks, kes suudab probleemi lahendada.
83. Kas oskate nimetada ala, kus saab kasutada mustrituvastust?
84. Selgitage masinõppes mõistet Perceptron?
Perceptron on defineeritud kui binaarsete klassifikaatorite juhendatud õppimise algoritm. See algoritm võimaldab neuronitel õppida ja töödelda antud treeningkomplekti elemente ükshaaval. Perceptroneid on kahte tüüpi, nimelt.
85. Mis on Isotooniline regressioon?
Isotoonset regressiooni kasutatakse iteratiivselt ideaalsete vahemaade sobitamiseks, et kaitsta suhtelist erinevust. Isotoonset regressiooni kasutatakse ka tõenäosuslikus klassifikatsioonis, et tasakaalustada juhendatavate masinõppemudelite prognoositud tõenäosusi.
86. Mis on Bayesi võrgud?
Bayesi võrku saab defineerida kui tõenäosuslikku graafilist mudelit, mis esitab DAG-i (suunatud atsüklilise graafiku) kaudu muutujate komplekti ja nende tingimuslikke sõltuvusi.
Näiteks Bayesi võrk esindaks tõenäosuslikke seoseid haiguste ja nende sümptomite vahel. Arvestades spetsiifilisi sümptomeid, saab võrku kasutada erinevate haiguste esinemise võimaluste arvutamiseks.
87. Kas saate selgitada Bayesi loogikaprogrammi kahte komponenti?
Bayesi loogikaprogramm koosneb peamiselt kahest komponendist.
88. Mis on inkrementaalõppe algoritm ansamblis?
Inkrementaalset õppemeetodit määratletakse kui algoritmi võimet õppida uutest andmetest, mis on saadaval pärast seda, kui klassifikaator on juba olemasolevast andmekogumist juba loodud.
89. Nimeta relatsioonilise hindamise tehnikate komponendid?
Relatsioonilise hindamise tehnika komponendid on loetletud allpool:
90. Kas saate selgitada klassifikatsioonivea bias-variance decomposition ansamblimeetodil?
Õppealgoritmi eeldatava vea saab jagada nihkeks ja dispersiooniks. Eelarvamus on mõõt, mis näitab, kui täpselt õppealgoritmi loodud keskmine klassifikaator sihtfunktsiooniga ühtib. Dispersioonitermin mõõdab, kui palju õpialgoritmi ennustus erinevate treeningkomplektide puhul kõigub.
91. Nimetage järjestikuse juhendatud õppe erinevad meetodid?
Allpool on toodud erinevad meetodid järjestikuse juhendatud õppe jaoks:
92. Mis on pakettstatistika õpe?
Treeningu andmestik on jagatud üheks või mitmeks partiiks. Kui ühe partii loomisel kasutatakse kõiki koolitusnäidiseid, nimetatakse seda õppimisalgoritmi partii gradiendi laskumiseks. Kui antud partii on ühe valimi suurune, nimetatakse õppimisalgoritmi stohhastiliseks gradiendi laskumiseks.
93. Kas oskate nimetada robootika ja infotöötluse valdkondi, kus tekib järjestikuse ennustamise probleem?
Allpool on toodud robootika ja infotöötluse valdkonnad, kus tekib järjestikuse ennustamise probleem
94. Nimetage erinevad kategooriad, mida saate järjestusõppe protsessi kategoriseerida?
Erinevad kategooriad, kuhu saate järjestusõppe protsessi kategoriseerida, on loetletud allpool.
95. Mis on järjestuse ennustamine?
Järjestuse ennustamise eesmärk on ennustada jada elemente eelnevate elementide põhjal.
Ennustusmudelit treenitakse treeningjärjestuste komplektiga. Treeningul kasutatakse mudelit järjestuste ennustamiseks. Prognoos hõlmab jada järgmiste üksuste ennustamist. Sellel ülesandel on mitmeid rakendusi, nagu veebilehtede eellaadimine, ilmaennustus, tarbekaupade soovitused ja börsiennustused.
Järjestuse ennustamise probleemide näited on järgmised:
96. Selgitage PAC õppimist?
Tõenäoliselt ligikaudu õige, st PAC-õpe on defineeritud kui teoreetiline raamistik, mida kasutatakse õppimisalgoritmi üldistusvea analüüsimiseks antud treeningkomplekti vea ja mõningate keerukuse mõõtmiste osas. Peamine eesmärk on siin tavaliselt näidata, et algoritm suudab suure tõenäosusega saavutada madala üldistusvea.
97. Mis on PCA, KPCA ja ICA ning milleks neid kasutatakse?
Põhikomponentide analüüs (PCA): See muudab algsed sisendid lineaarselt uuteks korrelatsioonita funktsioonideks.
Kernelipõhine põhikomponentide analüüs (KCPA) : see on mittelineaarne PCA, mis on välja töötatud kerneli meetodil.
Sõltumatu komponentide analüüs (ICA): ICA-s teisendatakse algsed sisendid lineaarselt teatud tunnusteks, mis on üksteisest statistiliselt sõltumatud.
98. Selgitage masinõppes mudeli loomise kolme etappi?
Kolm etappi on järgmised:
99. Selgitage mõistet hüpotees ML-is?
Masinõpet, eriti juhendatud õpet, saab määratleda kui soovi kasutada saadaolevaid andmeid funktsiooni õppimiseks, mis kaardistab kõige paremini sisendid väljunditega.
Tehniliselt nimetatakse seda probleemi funktsiooni lähendamiseks, kus me lähendame tundmatut sihtfunktsiooni, mille olemasolu eeldame, et see suudab antud sisendid väljunditeks kõige paremini kaardistada, võttes arvesse probleemi domeeni kõiki võimalikke kaalutlusi.
Mudeli näidet, mis lähendab sihtfunktsiooni ja teostab sisendite vastendamist väljunditega, on masinõppes tuntud kui hüpotees.
Algoritmi valik ja algoritmi konfiguratsioon määratlevad võimalike hüpoteeside ruumi, mida mudel võib moodustada.
100. Selgitage masinõppe mõisteid Eepoch, Eentropy, Bbias ja Vvariance?
Epohh on masinõppes laialdaselt kasutatav termin, mis näitab kogu koolituse andmestiku läbimiste arvu, mille masinõppealgoritm on lõpetanud. Kui partii suurus on kogu treeningu andmekogum, määratletakse epohhide arv iteratsioonide arvuna.
Entroopia masinõppes võib defineerida kui häire või ebakindluse mõõdikut. Masinõppemudelite ja andmeteadlaste peamine eesmärk üldiselt on ebakindluse vähendamine.
Andmed eelarvamus on vea tüüp, mille puhul teatud andmestiku elemendid on teistest suurema kaaluga.
Dispersioon on määratletud kui summa, mida sihtfunktsiooni hinnang muutub, kui kasutatakse teistsugust treeningandmete kogumit. Sihtfunktsiooni hindab tavaliselt treeningandmete põhjal masinõppe algoritm.
Edu teile masinõppeintervjuul. Loodame, et meie masinõppeintervjuu küsimused ja vastused olid teile abiks. Saate vaadata ka meie Küberturvalisuse intervjuu küsimused ja vastused mis võib teile veidi abiks olla.