Tá líon na n-iarratas agus an tábhacht a bhaineann le comhéadain gutha ag fás go tapa
Teicneolaíocht

Tá líon na n-iarratas agus an tábhacht a bhaineann le comhéadain gutha ag fás go tapa

D'fhoghlaim teaghlach Meiriceánach i Portland, Oregon le déanaí gur thaifead cúntóir gutha Alex a gcuid comhráite príobháideacha agus gur sheol siad chuig cara iad. Dúirt úinéir an tí, ar a dtugtar Danielle ó na meáin chumarsáide, le tuairisceoirí nach mbeadh sí "go deo plugáil isteach arís leis an bhfeiste sin toisc nach féidir muinín a chur aisti."

Alexa, a sholáthraíonn cainteoirí Echo (1) agus giuirléidí eile i na mílte tithe sna Stáit Aontaithe, tosaíonn sé ag taifeadadh nuair a chloiseann sé a ainm nó "focal glao" á labhairt ag an úsáideoir. Ciallaíonn sé seo, fiú má luaitear an focal "Alexa" i bhfógra teilifíse, féadfaidh an gléas tosú ag taifeadadh. Sin go díreach a tharla sa chás seo, a deir Amazon, an dáileoir crua-earraí.

"Léirmhínigh an cúntóir guth an chuid eile den chomhrá mar ordú chun teachtaireacht a sheoladh," a dúirt an chuideachta i ráiteas. “Ag am éigin, d’fhiafraigh Alexa os ard: “Cé leis?” Ba cheart don mheaisín leanúint den chomhrá teaghlaigh faoi urláir crua-adhmaid a fheiceáil mar mhír ar liosta teagmhála an chustaiméara.” Ar a laghad sin a cheapann Amazon. Mar sin, laghdaítear an t-aistriúchán go sraith timpistí.

Tá an imní fós, áfach. Mar gheall ar chúis éigin i dteach inar mhothaigh muid go fóill ar a suaimhneas, ní mór dúinn dul isteach de shaghas éigin “mód gutha”, féachaint ar a ndeirimid, ar a bhfuil an teilifís ag craoladh agus, ar ndóigh, ar a bhfuil an cainteoir nua seo ar an cófra tarraiceán. deir . linn.

Mar sin féin, In ainneoin imperfections teicneolaíochta agus imní príobháideachta, leis an méadú ar an éileamh atá ar fheistí cosúil leis an Amazon Echo, tá daoine ag tosú a fháil i dtaithí ar an smaoineamh ar idirghníomhú le ríomhairí ag baint úsáide as a nguth..

Mar a thug Werner Vogels, CTO Amazon, faoi deara le linn a sheisiún AWS maidir le:Invent go déanach in 2017, tá an teicneolaíocht tar éis ár gcumas idirghníomhú le ríomhairí a theorannú go dtí seo. Clóscríobhaimid eochairfhocail isteach i Google ag baint úsáide as an méarchlár, toisc gurb é seo an bealach is coitianta agus is éasca fós chun faisnéis a chur isteach i meaisín.

A dúirt Vogels. -

ceithre mhór

Agus inneall cuardaigh Google á úsáid againn ar an bhfón, is dócha gur thugamar faoi deara comhartha micreafón le glaoch chun labhairt i bhfad ó shin. seo Google anois (2), ar féidir leo ceist chuardaigh a ordú, teachtaireacht a chur isteach trí ghuth, etc. Le blianta beaga anuas, tá feabhas mór tagtha ar Google, Apple agus Amazon teicneolaíocht aitheantais gutha. Ní hamháin go ndéanann cúntóirí gutha ar nós Alexa, Siri agus Google Assistant do ghuth a thaifeadadh, ach tuigeann siad freisin cad a deir tú leo agus freagraíonn siad ceisteanna.

Tá Google Now ar fáil saor in aisce do gach úsáideoir Android. Is féidir leis an bhfeidhmchlár, mar shampla, aláram a shocrú, réamhaisnéis na haimsire a sheiceáil agus an bealach a sheiceáil ar léarscáileanna Google. Síneadh comhrá ar stáit Google Now Cúntóir Google () – cúnamh fíorúil d’úsáideoir an trealaimh. Tá sé ar fáil go príomha ar ghléasanna soghluaiste agus cliste tí. Murab ionann agus Google Now, is féidir leis páirt a ghlacadh i malartú déthreo. Tháinig an cúntóir debuted i mí na Bealtaine 2016 mar chuid den aip teachtaireachtaí Google Allo, chomh maith le cainteoir gutha Google Home (3).

3. Baile Google

Tá a chúntóir fíorúil féin ag an gcóras IOS freisin, Siri, ar clár é atá san áireamh le córais oibriúcháin Apple iOS, watchOS, tvOS homepod, agus macOS. Chuaigh Siri chun tosaigh le iOS 5 agus an iPhone 4s i mí Dheireadh Fómhair 2011 ag an gcomhdháil iPhone Let's Talk.

Tá na bogearraí bunaithe ar chomhéadan comhrá: aithníonn sé óráid nádúrtha an úsáideora (le iOS 11 is féidir freisin orduithe a chur isteach de láimh), freagraíonn sé ceisteanna agus críochnaíonn sé tascanna. Buíochas le tabhairt isteach na foghlama meaisín, cúntóir le himeacht ama anailís ar roghanna pearsanta an t-úsáideoir chun torthaí agus moltaí níos ábhartha a sholáthar. Éilíonn Siri nasc Idirlín seasmhach - is iad Bing agus Wolfram Alpha na príomhfhoinsí faisnéise anseo. Thug iOS 10 tacaíocht isteach le haghaidh síntí tríú páirtí.

Ceann eile de na ceithre mhór Cortana. Is cúntóir pearsanta cliste é cruthaithe ag Microsoft. Tacaítear leis ar Windows 10, Windows 10 Mobile, Windows Phone 8.1, Xbox One, Skype, Microsoft Band, Microsoft Band 2, Android, agus ardáin iOS. Tugadh Cortana isteach den chéad uair ag Comhdháil Fhorbróirí Microsoft Build i mí Aibreáin 2014 i San Francisco. Tagann ainm an chláir ó ainm charachtair ón tsraith cluiche Halo. Tá Cortana ar fáil i mBéarla, Iodáilis, Spáinnis, Fraincis, Gearmáinis, Sínis agus Seapáinis.

Úsáideoirí an chláir atá luaite cheana féin Alexa ní mór dóibh srianta teanga a mheas freisin - ní labhraíonn an cúntóir digiteach ach Béarla, Gearmáinis, Fraincis agus Seapáinis.

Úsáideadh Cúntóir Fíorúil Amazon ar dtús i gcainteoirí cliste Amazon Echo agus Amazon Echo Dot a d'fhorbair Amazon Lab126. Cuireann sé ar chumas idirghníomhaíocht gutha, athsheinm ceoil, cruthú liosta le déanamh, socrú aláraim, sruthú podchraoltaí, athsheinm closleabhair, agus aimsir fíor-ama, trácht, spóirt, agus faisnéis nuachta eile ar nós nuacht (4). Is féidir le Alexa feistí cliste iolracha a rialú chun córas uathoibrithe baile a chruthú. Is féidir é a úsáid freisin chun siopadóireacht áisiúil a dhéanamh i siopa Amazon.

4. Cad a Bhaineann Úsáideoirí Macalla as (De réir Taighde)

Is féidir le húsáideoirí an taithí Alexa a fheabhsú trí "scileanna" Alexa a shuiteáil (), gnéithe breise a d'fhorbair tríú páirtithe, dá ngairtear níos coitianta apps cosúil le cláir aimsire agus fuaime i suíomhanna eile. Ligeann an chuid is mó de ghléasanna Alexa duit do chúntóir fíorúil a ghníomhachtú le pasfhocal dúisithe, ar a dtugtar .

Is cinnte go bhfuil Amazon i gceannas ar mhargadh na gcainteoirí cliste inniu (5). Tá IBM, a thug isteach seirbhís nua i mí an Mhárta 2018, ag iarraidh dul isteach sna ceithre barr Cúntóir Watson, atá deartha do chuideachtaí atá ag iarraidh a gcórais féin de chúntóirí fíorúla a chruthú le rialú guth. Cad é an buntáiste a bhaineann le réiteach IBM? De réir ionadaithe na gcuideachtaí, ar an gcéad dul síos, ar dheiseanna i bhfad níos mó le haghaidh pearsantú agus cosaint príobháideachta.

Ar dtús, níl Watson Assistant brandáilte. Is féidir le cuideachtaí a gcuid réitigh féin a chruthú ar an ardán seo agus iad a lipéadú lena mbranda féin.

Ar an dara dul síos, is féidir leo a gcórais chúnta a oiliúint ag baint úsáide as a dtacair sonraí féin, rud a deir IBM a fhágann go bhfuil sé níos éasca feidhmeanna agus orduithe a chur leis an gcóras sin ná teicneolaíochtaí eile VUI (comhéadan úsáideora gutha).

Ar an tríú dul síos, ní sholáthraíonn Cúntóir Watson faisnéis do IBM faoi ghníomhaíocht úsáideoirí - ní féidir le forbróirí réitigh ar an ardán ach sonraí luachmhara a choinneáil dóibh féin. Idir an dá linn, ba chóir go mbeadh a fhios ag duine ar bith a thógann feistí, mar shampla le Alexa, go dtiocfaidh a gcuid sonraí luachmhara ar Amazon.

Tá roinnt feidhmeanna ag Watson Assistant cheana féin. Baineadh úsáid as an gcóras, mar shampla, ag Harman, a chruthaigh cúntóir guth do charr coincheap Maserati (6). Ag Aerfort München, tugann cúntóir IBM cumhacht do róbat Pepper chun cabhrú le paisinéirí bogadh thart. Is é an tríú sampla ná Chameleon Technologies, áit a n-úsáidtear teicneolaíocht gutha i méadar baile cliste.

6. Cúntóir Watson i gcarr coincheap Maserati

Is fiú a chur leis nach bhfuil an teicneolaíocht bhunúsach anseo nua freisin. Áiríonn Cúntóir Watson cumais criptithe do tháirgí IBM atá ann cheana féin, Watson Conversation, agus Watson Virtual Agent, chomh maith le APIanna le haghaidh anailíse teanga agus comhrá.

Ní hamháin go bhfuil Amazon ina cheannaire i dteicneolaíocht gutha cliste, ach tá sé ag iompú ina ghnó díreach. Mar sin féin, tá roinnt cuideachtaí tar éis triail a bhaint as comhtháthú Echo i bhfad níos luaithe. Thug Sisense, cuideachta sa tionscal BI agus anailísíochta, comhtháthú Echo isteach i mí Iúil 2016. Ina dhiaidh sin, chinn Roxy tosaithe a chuid bogearraí agus crua-earraí guth-rialaithe féin a chruthú don tionscal fáilteachais. Níos luaithe i mbliana, thug Synqq feidhmchlár chun nótaí a ghlacadh a úsáideann próiseáil gutha agus teanga nádúrtha chun nótaí agus iontrálacha féilire a chur leis gan iad a chlóscríobh ar mhéarchlár.

Tá ard-uaillmhianta ag na gnólachtaí beaga seo go léir. An chuid is mó ar fad, áfach, d'fhoghlaim siad nach bhfuil gach úsáideoir ag iarraidh a gcuid sonraí a aistriú chuig Amazon, Google, Apple nó Microsoft, arb iad na himreoirí is tábhachtaí maidir le hardáin cumarsáide gutha a thógáil.

Meiriceánaigh ag iarraidh a cheannach

In 2016, b’ionann cuardach gutha agus 20% de chuardaigh mhóibíleacha Google. Luann daoine a úsáideann an teicneolaíocht seo ar bhonn laethúil a áisiúlacht agus iltasking i measc na mbuntáistí is mó a bhaineann leis. (mar shampla, an cumas inneall cuardaigh a úsáid agus tú ag tiomáint carr).

Measann anailísithe Visiongain luach margaidh reatha na gcúntóirí digiteacha cliste ag $1,138 billiún.Tá níos mó agus níos mó meicníochtaí dá leithéid ann. De réir Gartner, faoi dheireadh 2018 cheana féin 30% dár n-idirghníomhaíochtaí le teicneolaíocht trí chomhráite le córais ghutha.

Measann gnólacht taighde na Breataine IHS Markit go sroichfidh an margadh do chúntóirí digiteacha faoi thiomáint AI 4 billiún feiste faoi dheireadh na bliana seo, agus d'fhéadfadh an líon sin ardú go 2020 billiún faoi 7.

De réir tuairiscí ó eMarketer agus VoiceLabs, d’úsáid 2017 milliún Meiriceánach rialú gutha uair sa mhí ar a laghad in 35,6. Ciallaíonn sé seo méadú de bheagnach 130% ar an mbliain roimhe sin. Táthar ag súil go dtiocfaidh fás 2018% i 23 ar mhargadh na gcúntóirí digiteacha amháin. Ciallaíonn sé seo go mbeidh tú á n-úsáid cheana féin. 60,5 milliún Meiriceánaigh, as a dtiocfaidh airgead nithiúil dá dtáirgeoirí. Measann RBC Capital Markets go nginfidh comhéadan Alexa suas le $2020 billiún in ioncam do Amazon faoi 10.

Nigh, bácáil, glan!

Tá comhéadain gutha ag dul isteach i margaí fearas tí agus leictreonaice tomhaltóra de réir a chéile. D'fhéadfaí é seo a fheiceáil cheana féin le linn taispeántas IFA 2017 na bliana seo caite. Thug an chuideachta Mheiriceá Neato Robotics isteach, mar shampla, folúsghlantóir robot a nascann le ceann de roinnt ardán baile cliste, lena n-áirítear córas Amazon Echo. Trí labhairt leis an gcainteoir cliste Echo, is féidir leat treoir a thabhairt don mheaisín do theach ar fad a ghlanadh ag amanna sonracha den lá nó den oíche.

Taispeánadh táirgí guthghníomhaithe eile ag an seó, ó theilifíseáin chliste a dhíol an chuideachta Turcach Vestel faoi bhranda Toshiba agus pluideanna téite ag an gcuideachta Gearmánach Beurer. Is féidir go leor de na gléasanna leictreonacha seo a ghníomhachtú go cianda trí úsáid a bhaint as fóin chliste.

Mar sin féin, de réir ionadaithe Bosch, tá sé ró-luath a rá cé acu de na roghanna cúntóir baile a bheidh ceannasach. Ag IFA 2017, léirigh grúpa teicniúil Gearmánach meaisíní níocháin (7), oighinn agus meaisíní caife a nascann le Echo. Tá Bosch ag iarraidh freisin go mbeidh a chuid feistí comhoiriúnach le hardáin ghutha Google agus Apple sa todhchaí.

7. Meaisín níocháin Bosch a nascann le Amazon Echo

Tá cuideachtaí ar nós Fujitsu, Sony agus Panasonic ag forbairt a gcuid réitigh cúntóir gutha AI-bhunaithe féin. Tá Sharp ag cur an teicneolaíocht seo le hoighinn agus robots beaga ag dul isteach sa mhargadh. Tá Nippon Telegraph & Telephone ag fostú déantóirí crua-earraí agus bréagán chun córas hintleachta saorga guth-rialaithe a oiriúnú.

Seanchoincheap. An bhfuil a cuid ama tagtha faoi dheireadh?

Go deimhin, tá coincheap an Chomhéadain Úsáideora Gutha (VUI) thart le blianta fada. Is dócha go raibh súil ag duine ar bith a d'amharc ar Star Trek nó 2001: A Space Odyssey blianta ó shin go ndéanfaí rialú ar ríomhairí lenár nguthanna timpeall na bliana 2000. Chomh maith leis sin, ní hamháin gur scríbhneoirí ficsin eolaíochta a chonaic acmhainneacht an chomhéadain seo. I 1986, d’fhiafraigh taighdeoirí Nielsen do ghairmithe TF cad é an t-athrú is mó ar chomhéadain úsáideora faoin mbliain 2000, dar leo. Is minic a dhírigh siad ar fhorbairt comhéadain gutha.

Tá cúiseanna dóchais le réiteach den sórt sin. Tar éis an tsaoil, is í cumarsáid bhriathartha an bealach is nádúrtha do dhaoine smaointe a mhalartú go comhfhiosach, agus mar sin is cosúil gurb é an réiteach is fearr go dtí seo é a úsáid le haghaidh idirghníomhú daonna-inneall.

Ceann de na chéad VUIanna, ar a dtugtar bosca bróg, a chruthaigh IBM go luath sna 60í. Bhí sé mar réamhtheachtaí ar chórais aitheantais gutha an lae inniu. Mar sin féin, bhí forbairt feistí VUI teoranta ag teorainneacha na cumhachta ríomhaireachta. Teastaíonn go leor iarracht chun urlabhra an duine a pharsáil agus a léirmhíniú i bhfíor-am, agus thóg sé breis agus caoga bliain chun an pointe a bhí indéanta a bhaint amach.

Thosaigh feistí le comhéadan gutha le feiceáil i dtáirgeadh mais i lár na 90í, ach ní raibh tóir orthu. Ba é an chéad teileafón le rialú guth (diailiú). Philips Sparkscaoileadh i 1996. Mar sin féin, ní raibh an gléas nuálach agus éasca le húsáid seo saor ó theorainneacha teicneolaíochta.

Buaileann fóin eile atá feistithe le foirmeacha comhéadain gutha (a chruthaigh cuideachtaí ar nós RIM, Samsung nó Motorola) an margadh go rialta, rud a ligeann d'úsáideoirí dhiailiú trí ghuth nó teachtaireachtaí téacs a sheoladh. B’éigean dóibh go léir, áfach, orduithe sonracha a chur de ghlanmheabhair agus iad a fhuaimniú i bhfoirm éigeanta, shaorga, arna oiriúnú do chumais fheistí an ama sin. Chruthaigh sé seo líon mór earráidí, rud a d'eascair míshástacht na n-úsáideoirí dá bharr.

Mar sin féin, táimid ag dul isteach i ré nua ríomhaireachta anois, ina bhfuil dul chun cinn san fhoghlaim meaisín agus i bhforbairt na hintleachta saorga ag scaoileadh acmhainneacht an chomhrá mar bhealach nua chun idirghníomhú leis an teicneolaíocht (8). Tá líon na bhfeistí a thacaíonn le hidirghníomhaíocht gutha ina fhachtóir tábhachtach a raibh tionchar mór aige ar fhorbairt VUI. Sa lá atá inniu ann, tá fóin chliste ag beagnach 1/3 de dhaonra an domhain cheana féin ar féidir iad a úsáid don chineál seo iompair. Tá an chuma ar an scéal go bhfuil formhór na n-úsáideoirí réidh ar deireadh lena gcuid comhéadain gutha a oiriúnú.

8. Stair nua-aimseartha ar fhorbairt an chomhéadan guth

Mar sin féin, sular féidir linn labhairt go saor le ríomhaire, mar a rinne laochra A Space Odyssey, ní mór dúinn roinnt fadhbanna a shárú. Níl meaisíní an-mhaith fós ag láimhseáil nuances teanga. Thairis sin mothaíonn go leor daoine míchompordach fós ag tabhairt orduithe gutha d’inneall cuardaigh.

Léiríonn staitisticí go n-úsáidtear cúntóirí gutha go príomha sa bhaile nó i measc cairde dlúth. Níor admhaigh aon duine ar cuireadh agallamh orthu gur úsáid siad cuardach gutha in áiteanna poiblí. Mar sin féin, is dócha go n-imeoidh an imshuí seo le scaipeadh na teicneolaíochta seo.

ceist deacair go teicniúil

Is é an fhadhb atá os comhair córais (ASR) ná sonraí úsáideacha a bhaint as comhartha cainte agus é a nascadh le focal áirithe a bhfuil brí áirithe aige do dhuine. Bíonn na fuaimeanna a tháirgtear difriúil gach uair.

Athraitheacht comhartha cainte is é a mhaoin nádúrtha, a aithnímid, mar shampla, blas nó tuiníocht dá bharr. Tá tasc ar leith ag gach eilimint den chóras aitheantais cainte. Bunaithe ar an comhartha próiseáilte agus a paraiméadair, cruthaítear múnla fuaimiúil, a bhaineann leis an múnla teanga. Is féidir leis an gcóras aitheantais oibriú ar bhonn líon beag nó mór patrún, a chinneann méid an stór focal lena n-oibríonn sé. Is féidir leo a bheith foclóirí beaga i gcás córais a aithníonn focail nó orduithe aonair, chomh maith le bunachair shonraí mhóra ina bhfuil coibhéis an tacair teanga agus an tsamhail teanga (gramadach) á cur san áireamh.

Fadhbanna a bhíonn le sárú ag comhéadain gutha ar an gcéad dul síos cainte a thuiscint i gceart, ina ndéantar, mar shampla, seichimh ghramadaí iomlána a fhágáil ar lár go minic, earráidí teanga agus foghraíochta, earráidí, easnaimh, lochtanna cainte, comhainmneacha, athrá gan údar, etc. Ní mór do na córais ACP seo go léir oibriú go tapa agus go hiontaofa. Ar a laghad is iad sin na hionchais.

Is é foinse na ndeacrachtaí freisin comharthaí fuaimiúla seachas an chaint aitheanta a théann isteach in ionchur an chórais aitheantais, i.e. gach saghas cur isteach agus torann. Sa chás is simplí, is gá duit iad scag amach. Is cosúil go bhfuil an tasc seo gnáthamh agus éasca - tar éis an tsaoil, déantar comharthaí éagsúla a scagadh agus tá a fhios ag gach innealtóir leictreonaic cad atá le déanamh i gcás den sórt sin. Mar sin féin, ní mór é seo a dhéanamh go han-chúramach agus go cúramach má tá toradh an aitheantais cainte chun ár n-ionchais a chomhlíonadh.

Mar gheall ar an scagadh a úsáidtear faoi láthair is féidir an torann seachtrach a phiocann an micreafón agus airíonna inmheánacha an chomhartha cainte féin a bhaint, mar aon leis an gcomhartha cainte, rud a fhágann go bhfuil sé deacair é a aithint. Mar sin féin, tagann fadhb theicniúil i bhfad níos casta chun cinn nuair a bhíonn an cur isteach ar an gcomhartha cainte anailísithe ... comhartha cainte eile, is é sin, mar shampla, plé ard timpeall. Tugtar an cheist seo sa litríocht mar a thugtar air . Éilíonn sé seo cheana féin úsáid a bhaint as modhanna casta, mar a thugtar orthu. deconvolution (unraveling) an comhartha.

Ní chríochnaíonn na fadhbanna le haitheantas cainte ansin. Is fiú a thuiscint go mbíonn go leor cineálacha éagsúla faisnéise ag gabháil leis an gcaint. Molann guth an duine inscne, aois, carachtair éagsúla an úinéara nó staid a shláinte. Tá roinn leathan d’innealtóireacht bhithleighis ann a dhéileálann le diagnóis galair éagsúla bunaithe ar na feiniméin fhuaimiúla tréithiúla a fhaightear sa chomhartha cainte.

Tá feidhmchláir ann freisin ina bhfuil sé mar phríomhchuspóir anailís fhuaimiúil ar chomhartha cainte an cainteoir a aithint nó a fhíorú gurb é an duine a éilíonn sé a bheith (guth in ionad eochair, pasfhocal nó cód PUK). Féadfaidh sé seo a bheith tábhachtach, go háirithe maidir le teicneolaíochtaí tógála cliste.

Is é an chéad chomhpháirt de chóras aitheantais urlabhra микрофон. Mar sin féin, is beag úsáid a bhaineann an comhartha a phiocann an micreafón suas de ghnáth. Léiríonn staidéir go n-athraíonn cruth agus cúrsa na toinne fuaime go mór ag brath ar an duine, ar luas na cainte, agus go páirteach ar ghiúmar an idirghabhálaí - agus go pointe beag léiríonn siad an-ábhar na n-orduithe labhartha.

Dá bhrí sin, ní mór an comhartha a phróiseáil i gceart. Soláthraíonn fuaimíocht, foghraíocht agus ríomheolaíocht nua-aimseartha le chéile sraith shaibhir uirlisí ar féidir a úsáid chun comhartha cainte a phróiseáil, a anailísiú, a aithint agus a thuiscint. Speictream dinimiciúil an chomhartha, mar a thugtar air speictreamaí dinimiciúla. Is furasta go leor iad a fháil, agus tá an chaint, a chuirtear i láthair i bhfoirm speictreagraim dhinimiciúil, sách éasca le haithint trí úsáid a bhaint as teicníochtaí cosúil leis na cinn a úsáidtear in aithint íomhá.

Is féidir gnéithe simplí cainte (mar shampla, orduithe) a aithint trí chosúlacht shimplí speictreagraim iomlána. Mar shampla, níl ach idir dheichí agus cúpla céad focal agus frása i bhfoclóir guth-ghníomhaithe fón póca, de ghnáth réamhchruachtaithe ionas gur féidir iad a aithint go héasca agus go héifeachtach. Is leor é seo le haghaidh tascanna rialaithe simplí, ach cuireann sé teorainn mhór ar an iarratas iomlán. Ní thacaíonn córais a tógadh de réir na scéime, mar riail, ach le cainteoirí sonracha a bhfuil guthanna oilte go speisialta ina leith. Mar sin má tá duine nua ann atá ag iarraidh a ghuth a úsáid chun an córas a rialú, is dócha nach nglacfar leo.

Tugtar toradh na hoibríochta seo speictream 2-W, is é sin, speictream déthoiseach. Tá gníomhaíocht eile sa bhloc seo ar fiú aird a thabhairt uirthi - deighilt. Go ginearálta, táimid ag caint faoi chomhartha cainte leanúnach a bhriseadh suas i gcodanna is féidir a aithint ar leithligh. Is ó na diagnóisí aonair seo amháin a dhéantar an t-aitheantas iomlán a fhoirmiú. Tá an nós imeachta seo riachtanach toisc nach féidir óráid fhada agus casta a aithint in aon turas amháin. Scríobhadh imleabhair iomlána cheana féin faoi na míreanna ar chóir idirdhealú a dhéanamh orthu i gcomhartha cainte, mar sin ní dhéanfaimid cinneadh anois cé acu ar cheart fóinéimí (coibhéisí fuaime), siollaí, nó b'fhéidir allafóin a bheith sna míreanna oirirce.

Tagraíonn an próiseas aitheantais uathoibríoch i gcónaí do roinnt gnéithe de rudaí. Tá tástáil déanta ar na céadta tacair de pharaiméadair éagsúla don chomhartha cainte.Tá an comhartha cainte roinnte i bhfrámaí aitheanta agus a bhfuil gnéithe roghnaithetrína gcuirtear na frámaí seo i láthair sa phróiseas aitheantais, is féidir linn a dhéanamh (do gach fráma ar leithligh) catagóiriú, i.e. aitheantóir a shannadh don fhráma, a léireoidh é sa todhchaí.

An chéad chéim eile cóimeáil frámaí i bhfocail ar leith - an chuid is mó go minic bunaithe ar an mar a thugtar air. múnla samhlacha Markov intuigthe (HMM-). Ansin tagann montáis na bhfocal abairtí iomlána.

Is féidir linn filleadh ar an gcóras Alexa anois ar feadh nóiméad. Léiríonn a shampla próiseas ilchéime de mheaisín "tuiscint" duine - níos cruinne: ordú a thug sé nó ceist a cuireadh.

Is rudaí go hiomlán difriúil iad focail a thuiscint, brí a thuiscint, agus rún an úsáideora a thuiscint.

Dá bhrí sin, is é an chéad chéim eile ná obair an mhodúil NLP (), a bhfuil de chúram air aithint rún úsáideora, i.e. brí na hordaithe/na ceiste sa chomhthéacs inar dúradh é. Má aithnítear an rún, ansin sannadh scileanna agus cumais mar a thugtar orthu, i.e. an ghné shainiúil a fhaigheann tacaíocht ón gcúntóir cliste. I gcás ceist faoin aimsir, glaoitear foinsí sonraí aimsire, rud atá fós le próiseáil sa chaint (TTS - meicníocht). Mar thoradh air sin, cloiseann an t-úsáideoir an freagra ar an gceist a cuireadh.

Guth? Na healaíona grafacha? Nó b'fhéidir an dá?

Tá na córais idirghníomhaíochta nua-aimseartha is mó aitheanta bunaithe ar idirghabhálaí ar a dtugtar comhéadan grafach úsáideora (comhéadan grafach). Ar an drochuair, ní hé an GUI an bealach is soiléire chun idirghníomhú le táirge digiteach. Éilíonn sé seo go bhfoghlaimíonn úsáideoirí ar dtús conas an comhéadan a úsáid agus go gcuimhneoidh siad an fhaisnéis seo le gach idirghníomhaíocht ina dhiaidh sin. I go leor cásanna, tá guth i bhfad níos áisiúla, mar is féidir leat idirghníomhú leis an VUI go simplí trí labhairt leis an bhfeiste. Is lú fadhbanna is cúis le comhéadan nach gcuireann iachall ar úsáideoirí orduithe nó modhanna idirghníomhaíochta áirithe a chur de ghlanmheabhair agus a mheabhrú.

Ar ndóigh, ní chiallaíonn leathnú VUI comhéadain níos traidisiúnta a thréigean - ina ionad sin, beidh comhéadain hibrideacha ar fáil a chomhcheanglaíonn roinnt bealaí idirghníomhaithe.

Níl an comhéadan gutha oiriúnach do gach tasc i gcomhthéacs soghluaiste. Leis, cuirfimid glaoch ar chara ag tiomáint carr, agus fiú SMS a sheoladh chuige, ach is féidir a bheith ró-deacair na haistrithe is déanaí a sheiceáil - mar gheall ar an méid faisnéise a tharchuirtear chuig an gcóras () agus a ghineann an córas (córas). Mar a thugann Rachel Hinman le fios ina leabhar Mobile Frontier, is éifeachtaí VUI a úsáid agus tascanna á gcomhlíonadh nuair is beag an méid faisnéise ionchuir agus aschuir.

Tá fón cliste ceangailte leis an Idirlíon áisiúil ach tá sé deacair freisin (9). Gach uair a bhíonn úsáideoir ag iarraidh rud éigin a cheannach nó seirbhís nua a úsáid, caithfidh siad aip eile a íoslódáil agus cuntas nua a chruthú. Tá réimse le húsáid agus le forbairt comhéadain gutha cruthaithe anseo. In ionad iallach a chur ar úsáideoirí go leor aipeanna éagsúla a shuiteáil nó cuntais ar leith a chruthú do gach seirbhís, deir saineolaithe go n-aistreoidh VUI ualach na dtascanna an-deacair seo chuig cúntóir gutha faoi thiomáint AI. Beidh sé áisiúil dó gníomhaíochtaí dian a dhéanamh. Ní thabharfaimid ach orduithe dó.

9. Comhéadan gutha trí ghuthán cliste

Sa lá atá inniu ann, tá níos mó ná fón agus ríomhaire ceangailte leis an Idirlíon. Tá teirmeastait cliste, soilse, citeal agus go leor gléasanna eile atá comhtháite le IoT ceangailte leis an líonra freisin (10). Mar sin, tá gléasanna gan sreang timpeall orainn a líonann ár saol, ach ní luíonn gach ceann acu go nádúrtha isteach sa chomhéadan grafach úsáideora. Cabhróidh úsáid VUI leat iad a chomhtháthú go héasca inár dtimpeallacht.

10. Comhéadan gutha le hIdirlíon na Rudaí

Beidh cruthú comhéadan úsáideora gutha ina phríomhscil dearaidh go luath. Is fadhb fíor é seo - spreagfaidh an gá atá le córais ghutha a chur i bhfeidhm tú chun díriú níos mó ar dhearadh réamhghníomhach, is é sin, ag iarraidh tuiscint a fháil ar intinn tosaigh an úsáideora, ag súil lena riachtanais agus a n-ionchais ag gach céim den chomhrá.

Is bealach éifeachtach é guth chun sonraí a iontráil - ligeann sé d'úsáideoirí orduithe a eisiúint go tapa chuig an gcóras ar a dtéarmaí féin. Ar an láimh eile, soláthraíonn an scáileán bealach éifeachtach chun faisnéis a thaispeáint: ceadaíonn sé do chórais cuid mhór faisnéise a thaispeáint ag an am céanna, rud a laghdóidh an t-ualach ar chuimhne na n-úsáideoirí. Tá sé loighciúil gur ábhar misnigh é iad a chomhcheangal i gcóras amháin.

Ní thairgeann cainteoirí cliste cosúil leis an Amazon Echo agus Google Home taispeáint amhairc ar chor ar bith. Feabhsaítear cruinneas an aitheantais guth ag achair mheasartha go suntasach, ceadaíonn siad oibriú gan lámha, rud a mhéadaíonn a solúbthacht agus a n-éifeachtúlacht - tá siad inmhianaithe fiú d'úsáideoirí a bhfuil fóin chliste acu cheana féin le rialú guth. Mar sin féin, is teorainn mhór é an easpa scáileáin.

Ní féidir ach bípeanna a úsáid chun úsáideoirí a chur ar an eolas faoi orduithe féideartha, agus éiríonn sé an-sásamh as an aschur a léamh os ard seachas na tascanna is bunúsaí. Is iontach an rud é lasc ama a shocrú le hordú gutha agus tú ag cócaireacht, ach ní gá duit fiafraí den mhéid ama atá fágtha. Is tástáil chuimhne é don úsáideoir réamhaisnéis rialta aimsire a fháil, agus caithfidh sé/sí éisteacht le sraith fíricí agus iad a ionsú ar feadh na seachtaine, seachas iad a phiocadh suas go sracfhéachaint ar an scáileán.

Tá na dearthóirí cheana féin réiteach hibrideach, Echo Show (11), a chuir scáileán taispeána leis an gcainteoir cliste Echo bunúsach. Leathnaíonn sé seo go mór feidhmiúlacht an trealaimh. Mar sin féin, tá an Echo Show fós i bhfad níos lú in ann na feidhmeanna bunúsacha a bhí ar fáil le fada ar fhóin chliste agus táibléad a chomhlíonadh. Ní féidir leis (go fóill) scimeáil ar an ngréasán, léirmheasanna a thaispeáint, nó ábhar cart siopadóireachta Amazon a thaispeáint, mar shampla.

Is bealach níos éifeachtaí go bunúsach é taispeáint amhairc chun saibhreas faisnéise a sholáthar do dhaoine seachas fuaim amháin. Is féidir le dearadh le tosaíocht guth feabhas mór a chur ar idirghníomhaíocht gutha, ach san fhadtréimhse, go treallach gan úsáid a bhaint as an roghchlár amhairc ar mhaithe le hidirghníomhaíocht beidh sé cosúil le troid le lámh amháin ceangailte taobh thiar do chúl. Mar gheall ar chastacht na gcomhéadan cliste gutha agus taispeána ó cheann go ceann atá ag teacht chun cinn, ba cheart d’fhorbróirí machnamh dáiríre a dhéanamh ar chur chuige hibrideach maidir le comhéadain.

Mar gheall ar éifeachtacht agus luas na gcóras giniúna agus aitheantais cainte a mhéadú is féidir iad a úsáid i bhfeidhmchláir agus i réimsí mar, mar shampla:

• míleata (orduithe gutha in eitleáin nó héileacaptair, mar shampla, F16 VISTA),

• trascríobh uathoibríoch téacs (ó chaint go téacs),

• córais faisnéise idirghníomhacha (Prime Speech, tairseacha gutha),

• gléasanna soghluaiste (fóin, fóin chliste, táibléid),

• róbataic (Cleverbot - córais ASR in éineacht le hintleachta saorga),

• feithicleach (rialú saor ó lámha ar chomhpháirteanna gluaisteáin, mar Blue & Me),

• feidhmchláir tí (córais tí cliste).

Bígí ag faire amach do shábháilteacht!

Tá gléasanna gluaisteán, fearais tí, córais téimh/fuaraithe agus slándála tí, agus go leor fearais tí ag tosú ag baint úsáide as comhéadain gutha, go minic bunaithe ar AI. Ag an gcéim seo, seoltar na sonraí a fhaightear ó na milliúin de chomhráite le meaisíní chuig scamaill ríomhaireachta. Is léir go bhfuil suim ag lucht margaíochta iontu. Agus ní amháin iad.

Molann tuarascáil le déanaí ó shaineolaithe slándála Symantec nach rialaíonn úsáideoirí ordú gutha gnéithe slándála cosúil le glais dorais, gan trácht ar chórais slándála baile. Baineann an rud céanna le pasfhocail nó faisnéis rúnda a stóráil. Níl staidéar leordhóthanach déanta fós ar shlándáil na hintleachta saorga agus na dtáirgí cliste.

Nuair a éisteann gléasanna ar fud an tí le gach focal, bíonn an baol ann go ndéanfar córas hacking agus mí-úsáide ina ábhar imní ollmhór. Má fhaigheann ionsaitheoir rochtain ar an líonra áitiúil nó ar na seoltaí ríomhphoist a bhaineann leis, is féidir socruithe an fheiste cliste a athrú nó a athshocrú go socruithe monarchan, rud a fhágann go gcaillfear faisnéis luachmhar agus go scriosfar stair an úsáideora.

I bhfocail eile, tá eagla ar ghairmithe slándála nach bhfuil hintleachta saorga gutha agus VUI-tiomáinte fós cliste go leor chun sinn a chosaint ó bhagairtí féideartha agus ár mbéal a choinneáil dúnta nuair a iarrann strainséir rud éigin.

Add a comment