TölvurUpplýsingatækni

Modern tölva framtíðarsýn. Verkefni og tölva framtíðarsýn tækni. Forritun Computer Vision í Python

Hvernig á að kenna tölvu til að skilja hvað er sýndur í myndinni eða myndunum? Þetta virðist einfalt, en fyrir a tölva þessi er bara fylki sem samanstendur af núllum og sjálfur sem þú vilt að draga mikilvægar upplýsingar.

Hvað er tölva framtíðarsýn? Það er möguleiki að "sjá" tölvuna

Vision - er mikilvæg uppspretta upplýsinga fyrir mann að nota það, fáum við, samkvæmt ýmsum áætlunum, allt frá 70 til 90% af öllum upplýsingum. Og, auðvitað, ef við viljum búa sviði bíl, þurfum við að innleiða sömu færni og tölvu.

The vandamál af framtíðarsýn tölvu er hægt að fullyrða nokkuð skýrt. Hvað er "sjá"? Það er litið svo á að þar sem það eru bara með því að leita. Sem lauk mismun framtíðarsýn tölvu og mannsaugað. Framtíðarsýn fyrir okkur - það er uppspretta þekkingar um heiminn, auk uppspretta mæligildi upplýsinga - það er, getu til að skilja vegalengdir og stærðir.

Merkingartækni kjarnar ímynd

Horfa á myndina, getum við að lýsa því með mörgum eiginleikum, svo að segja, til að vinna úr merkingartækni upplýsingar.

Til dæmis, að horfa á þessa mynd, getum við sagt að það sé utandyra. Hvað er borg umferð. Að það eru bílar. Við getum held að þetta sé Suður-Asíu á uppsetningu hússins og hieroglyphics. Mannlýsing Mao Zedong skilja að þetta er Beijing, og ef einhver sá lifandi vídeó eða sjálfur hefði verið þar, myndi giska á að þetta er hin fræga Tiananmen Square.

Það sem við getum sagt meira um myndina, sjá það? Við getum þekkja hluti í myndinni, segja, að það er fólk hér nær - girðing. Hér regnhlífar, veggspjöld sem hússins. Þetta eru dæmi um flokka er mjög mikilvægt hlutir, sem stunda leit í augnablikinu.

Enn getum við lært sumir af the lögun eða eiginleikum hluta. Til dæmis, hér getum við ákveðum að þetta er ekki mynd af venjulegum kínversku, þ.e., Mao Zedong.

Samkvæmt ökutæki er hægt að ákveða að það er áhrifamikill mótmæla, og það er erfitt, það er ekki vansköpuð á hreyfingu. Um fánar má segja að það hlutir, þeir eru líka að flytja, en þeir eru ekki erfitt, stöðugt vansköpuð. Og á vettvangi þar er vindur, sem hægt er að ákvarða með því að þróa fánar, og geta jafnvel ákvarða stefnu vindi, til dæmis, það er blása frá vinstri til hægri.

Vegalengdir og lengdir í sjón tölvu

Mjög mikilvægt er mæling upplýsingar um tölvuna framtíðarsýn vísindi. Þetta er alls konar vegalengdir. Til dæmis, fyrir jeppanum er sérstaklega mikilvægt vegna þess að liðin eru frá jörðinni um 20 mínútur og svara eins mikið. Í samræmi við það, á tengilinn þangað og til baka - 40 mínútur. Og ef við tökum áætlun um hreyfingu skipanir jarðar, þú þarft að taka mið af þessu.

Tókst samþætt tækni framtíðarsýn tölva í tölvuleiki. Samkvæmt vídeó, getur þú byggja þrívítt líkan af hlutum, fólki og myndir á notanda getur aftur á þrívítt líkan af borgum. Og þá ganga á þeim.

tölva framtíðarsýn - frekar breiður svið. Það er náið samtvinnuð með ýmsum öðrum vísindum. Hluti af framtíðarsýn tölvu Það tekur myndvinnslu svæðið og stundum úthlutar tölva framtíðarsýn, sögulega.

Greining, mynstur viðurkenningu - leið að sköpun yfirburða greind

Við skulum skoða þessi hugtök sérstaklega.

Myndvinnsla - þetta er svæði reiknirit, sem inntak og úttak - mynd, og við höfum hann gera eitthvað.

mynd greiningu - er flatarmál sýn tölvu, sem fjallar um að vinna með tvívíð mynd og gera ályktanir af þessu.

Mynstur Viðurkenning - ágrip stærðfræði aga sem viðurkennir gögn í formi vektor. Það er, við innganginn - vektor og við höfum eitthvað að gera með það. Hvar sem ferjan er, við erum ekki svo mikilvægt að vita.

Tölva framtíðarsýn - það var upphaflega að endurheimta uppbyggingu tveggja vídda myndum. Í dag er þetta svæði hefur orðið víðtækari og það er hægt að túlka sem staðfestingu á öllum líkamlegum hlutum að gera, miðað við myndina. Það er, er það verkefni gervigreindar.

Samhliða sýn tölvu í algjörlega mismunandi sviði, í Geodesy, photogrammetry hefur þróast - mæling á fjarlægð milli hluta á tvívíðum myndum.

Vélmenni geta "séð"

Og að lokum - þetta er vél framtíðarsýn. Undir vél framtíðarsýn þýðir sýn á vélmenni. Það er ákvörðun sumra framleiðslu vandamál. Við getum sagt að tölva framtíðarsýn - er einn stór vísindi. Það sameinar sumir af the annar vísindi hluta. Og þegar tölva framtíðarsýn fær neina sérstaka umsókn, snýr það inn í a vél framtíðarsýn.

Tölva framtíðarsýn svæði hefur massa hagnýt forrit. Það er í tengslum við sjálfvirkni framleiðslu. Á fyrirtæki verða skilvirkari til að skipta handbók vinnuafli með vél. Vélin er ekki þreyttur, ekki sofa, hún hafði óreglulegum vinna tímaáætlun, hún er tilbúin til að vinna 365 daga á ári. Svo, með því að nota vél vinna, getum við fengið tryggingu niðurstöðu á ákveðnum tíma, og það er alveg áhugavert. Öll verkefni hafa skýra not fyrir tölvuna framtíðarsýn kerfi. Og það er ekkert betra en að sjá niðurstöður strax á myndinni aðeins í útreikning áfanga.

Á þröskuld heimi gervigreind

Auk svæðið - það er erfitt! Verulegur hluti heilans sem fyrir sjón, og það er talið að ef þú kennir tölvuna þína til að "sjá", það er, fullur notkun tölva framtíðarsýn, það er eitt af markmiðum fullt gervigreind. Ef við getum leyst vandann á mönnum stig, líklega á sama tíma, munum við leysa vandamál af AI. Það er mjög gott! Eða ekki mjög gott, ef þú lítur, "Terminator 2".

Hvers vegna er sýn - það er erfitt? Vegna þess að myndin af sama hlut getur verið mjög mismunandi eftir utanaðkomandi þáttum. Það fer eftir hlut af athugun stig líta öðruvísi.

Til dæmis, einn og sömu mynd, tekin frá mismunandi sjónarhornum. Og hvað er mest áhugavert í myndinni má eitt auga, tvö augu og hálft. Og eftir því samhengi (ef þessi mynd mannsins í skyrtu með máluð augu), sem augað getur verið fleiri en tvö.

Tölvan enn ekki skilja, en það "sér"

Annar þáttur sem gerir það erfitt - það er lýsingin. Hið sama vettvangur með mismunandi lýsingu mun líta öðruvísi. hlutar í getur verið breytilegur. Þar að auki, hluti af hvaða flokki. Hvernig getur þú sagt um mann sem hæð hans af 2 metra? Ekkert. Human Growth og kann að vera 2,3 m, og 80 cm. Eins og með aðrar gerðir af hlutum, hins vegar eru innan sviðs markmiðs sama flokki.

Sérstaklega býr hlutir gangast undir margs konar stofnum. Hair fólk, íþróttamenn, dýr. Horfðu á myndir af hestum í gangi, ákveða hvað er að gerast með faxi þeirra og hala er einfaldlega ómögulegt. A skarast hlutir í mynd? Ef þú shove tölvu mynd, jafnvel öflugasta vél finna erfitt að gefa rétta ákvörðun.

Næsti skjár - það er dulbúið. Sumir hlutir, dýr masquerading sem umhverfið, og alveg skillfully. Og sama bletti og litarefni. Engu að síður, við sjáum þá, þó ekki alltaf úr fjarska.

Annað vandamál - hreyfing. Hlutir í hreyfingu ólýsanlega gangast aflögun.

Margir af þeim hlutum eru mjög breytileg. Hér til dæmis, í tveimur myndunum fyrir neðan hlutum í "stól".

Og á þessu er hægt að sitja. En að kenna vél, þannig að mismunandi hlutir í lögun, lit, efni, sem allt er hlutur "stóll" - er mjög erfitt. Þetta er áskorun. Að samþætta aðferðir framtíðarsýn tölva - er að kenna vél til að skilja, greina, velt.

Sameining sýn tölva í ýmsum kerfum

Massi sýn tölva fór að komast meira árið 2001, þegar hann skapaði fyrsta andlit skynjari. Við gerðum það tveir höfundar: Viola, Jones. Það var í fyrsta fljótur og áreiðanlegur nógur reiknirit, sem sýnt kraft vél námsaðferðum.

Nú tölva framtíðarsýn nóg ný hagnýt forrit - viðurkenning á mönnum andlit.

En til að viðurkenna manninn og í bíó - handahófi sjónarhornum, mismunandi birtuskilyrði - það er ómögulegt. En til að leysa vandamál, eða einn sem er öðruvísi fólki með mismunandi lýsingu eða í mismunandi sitja, svipað og í ljósmynd í vegabréf, það er hægt með vissu.

a vegabréf photo kröfur að miklu leyti vegna lögun af the andlit viðurkenningu reiknirit.

Til dæmis, ef þú hafa a líffræðileg tölfræði vegabréf, í sumum nútíma flugvöllum, þú getur notað sjálfvirka vegabréf eftirlitskerfi.

Óleysta vandamál á sjón tölvu - getu til að viðurkenna hvaða texta

Kannski einhver notað OCR kerfið. Einn af þessum - sekt Reader, er mjög vinsæl í RuNet kerfinu. Það eru margir eyðublöð þar að fylla í gögnum, sem þeir eru fullkomlega skönnuð, þær upplýsingar sem er viðurkennd af kerfinu mjög vel. En með hvaða texta í myndinni að ástandið er miklu verra. Þetta vandamál enn óleyst.

Leikjum þar tölva framtíðarsýn, hreyfing handtaka

Sérstakur stórt svæði - er sköpun þrívítt líkan og hreyfing handtaka (sem er alveg góðum árangri í tölvuleikjum). Fyrsta kerfið sem notar tölvusjón - kerfi samskipti við tölvuna með bendingum. Þegar það var búið var margt opinn.

The reiknirit er hannað einfaldlega, en að stilla það tók að búa til rafall af tilbúnum myndum af fólki að fá milljón myndum. Supercomputer með þeim til að velja breytur reiknirit, sem hann vinnur nú vel.

Það er milljón myndir og viku teljanlegt supercomputer tími hægt er að búa til reiknirit sem eyðir 12% af getu einum örgjörva og gerir mann að skynja stöðu í rauntíma. Þessi Microsoft Kinect kerfi (2010).

Leita að myndum eftir efni gerir þér kleift að hlaða inn myndum á kerfinu, og niðurstöður hennar mun gefa allar myndirnar með sama efni og gert úr sama sjónarhorni.

Dæmi um framtíðarsýn tölvu: þrívítt og tvívíð kort eru nú gerðar með það. Kort fyrir siglingar bíla eru reglulega uppfærðar í samræmi við DVR.

Það er gagnagrunnur með milljörðum landmerktra myndum. Með því að hlaða myndina í dag, getur þú ákveðið hvar það var gert, og jafnvel með einhverjum sjónarhorni. Auðvitað, að því tilskildu að sá staður er vinsæll nóg að í einu ferðamennirnir og gert fjölda af myndum af svæðinu hafi verið þar.

vélmenni eru alls staðar

Vélfærafræði um þessar mundir, alls staðar, án þess að það á nokkurn hátt. Nú eru bílar sem hafa sérstaka myndavél sem þekkja vegfarendur og umferðarmerki til að senda skipanir til the bílstjóri (þetta á þann hátt tölvuforriti til að skoða, hjálpar motorist). Og það er fullkomlega sjálfvirk vélfærafræði ökutæki, en þeir geta ekki treyst eingöngu á vídeó myndavél kerfi án þess að nota mikið af viðbótarupplýsingum.

Modern myndavél - þetta er hliðstæða myndavél obscura

Við skulum tala um stafræna mynd. Nútíma stafrænar myndavélar er komið á meginreglunni um camera obscura. Aðeins í stað holu þar sem ljós fer inn í geisla og varpað á bak hólfsins á viðfangsefninu hringrás, höfum við sérstaka sjón kerfi sem kallast linsuna. Markmið hennar er að safna mikið ljós geisla og breyta henni þannig að allir geislum í gegnum raunverulegur benda til þess að fá vörpun og mynda myndina á filmu eða fylki.

Nútíma stafrænar myndavélar (Matrix) er samsett af einstakra þátta - punktar. Hver pixla hægt að mæla orku ljóss sem er atvik á pixla alls, og gefa eitt úttak númer. Því í stafrænni myndavél, fáum við í staðinn fyrir mynd birta sett ljós mælingum, lent í einum pixla - the tölva sjónsvið. Þess vegna, þegar myndin við sjáum ekki flæðandi línur og skýrar útlínur, og rist af lituðum reitum í mismunandi litum - pixel.

Hér fyrir neðan sérðu fyrsta stafræna mynd í heimi.

En í þessari mynd er það ekki? Color. Hvað er litur?

Sálfræðilegur skynjun lita

Litur - þetta er það sem við sjáum. Liturinn á einn og sama fyrir menn og ketti verður öðruvísi. Þar sem við (mönnum) og dýra sjón kerfi - framtíðarsýn er öðruvísi. Því lit - það er sálfræðileg gæði framtíðarsýn okkar sem á sér stað þegar horft hluti og ljós. Og ekki líkamlega eign hlut og ljós. Litur - er afleiðing af samspili ljós hluti, og vettvangur sjón kerfi okkar.

Forritun Computer Vision í Python með bókasöfnum

Ef þú hefur ákveðið að taka þátt alvarlega í rannsókn á sýn tölva, ætti strax að undirbúa sig fyrir fjölda erfiðleika, þetta vísindi er ekki auðveldasta og felur fjölda gildra. En "Programming Computer Vision á Python" the höfundar Jan Erik Solema - bók sem lýsir alla mest einfalt mál. Hér þú vilja kynnast þeim aðferðum sem viðurkenningu á ýmsum hlutum í 3D, læra að vinna með hljómtæki myndina, sýndarveruleika og mörgum öðrum forritum framtíðarsýn tölvu. Í bókinni eru nóg dæmi í Python. En skýringar eru settar fram, svo að segja, almenn, svo sem ekki að hafa of mikið of mikið rannsóknir og harður gögn. Vinna hentugur fyrir nemendur, áhugamenn og áhugamenn. Sækja þessa bók og aðra um tölvusjón (pdf-snið) geta verið í kerfinu.

Á því augnabliki, það eru opinn bókasafn tölva framtíðarsýn reiknirit og myndvinnslu og tölulegar reiknirit OpenCV. Hún er framkvæmd á flestum nútíma forritunarmál, er opinn uppspretta. Ef við tölum um framtíðarsýn tölvu, Python notar sem forritunarmál, það hefur einnig stuðning safninu, auk þess sem það er í stöðugri þróun og hefur mikla samfélag.

Félagið "Microsoft" veitir þjónustu sína Api-fær um að þjálfa tauganet til að vinna það með myndum af fólki. Það er einnig tækifæri til að beita tölvu sýn, Python notar sem forritunarmál.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 is.delachieve.com. Theme powered by WordPress.