Ceisiadau Technoleg Prosesu Iaith Naturiol

Sut fydd NLP Shape Dyfodol y Byd Tech?

Mae prosesu iaith naturiol, neu NLP yn gangen o ddeallusrwydd artiffisial sydd â llawer o oblygiadau pwysig ar y ffyrdd y mae cyfrifiaduron a phobl yn rhyngweithio. Mae iaith ddynol, a ddatblygwyd dros filoedd a miloedd o flynyddoedd, wedi dod yn ffurf cyfathrebu dawnus sy'n cynnwys cyfoeth o wybodaeth sy'n aml yn trosi'r geiriau yn unig. Bydd NLP yn dod yn dechnoleg bwysig wrth bontio'r bwlch rhwng cyfathrebu dynol a data digidol. Dyma 5 ffordd y bydd prosesu iaith naturiol yn cael ei defnyddio yn y blynyddoedd i ddod.

01 o 05

Cyfieithu Peiriant

Liam Norris / Stone / Getty Images

Gan fod gwybodaeth y byd ar-lein, mae'r dasg o wneud y data hwnnw'n hygyrch yn dod yn fwyfwy pwysig. Mae'r her o wneud gwybodaeth y byd yn hygyrch i bawb, ar draws rhwystrau ieithyddol, wedi golygu bod y gallu i gyfieithu dynol yn fwy tyfu. Mae cwmnļau arloesol fel Duolingo yn chwilio am recriwtio llawer iawn o bobl i gyfrannu, trwy gyd-fynd ag ymdrechion cyfieithu gyda dysgu iaith newydd. Ond mae cyfieithu peiriant yn cynnig dewis arall hyd yn oed yn fwy sefydlog i gysoni gwybodaeth y byd. Mae Google yn gwmni ar flaen y gad o ran cyfieithu peiriannau, gan ddefnyddio peiriant ystadegol perchnogol ar gyfer ei wasanaeth cyfieithu Google. Nid yw'r her gyda thechnolegau cyfieithu peiriannau yn cyfieithu geiriau, ond wrth gadw ystyr brawddegau, mater technolegol cymhleth sydd wrth wraidd NLP.

02 o 05

Ymladd Spam

Mae hidlwyr sbam wedi dod yn bwysig fel y llinell amddiffyn gyntaf yn erbyn problem gynyddol e-bost diangen. Ond mae bron pawb sy'n defnyddio e-bost yn helaeth wedi profi aflonyddwch dros negeseuon e-bost diangen sydd heb eu derbyn, neu negeseuon e-bost pwysig sydd wedi'u dal yn ddamweiniol yn yr hidlydd. Mae'r materion ffug-positif a ffug-negyddol o hidlwyr sbam wrth wraidd technoleg NLP, eto yn berwi i lawr i'r her o dynnu ystyr o llinynnau testun. Technoleg sydd wedi derbyn llawer o sylw yw hidlo sbam Bayesian , techneg ystadegol lle mae nifer y geiriau mewn e-bost yn cael ei fesur yn erbyn ei ddigwyddiad nodweddiadol mewn corpus o negeseuon e-bost spam a di-spam.

03 o 05

Echdynnu Gwybodaeth

Mae llawer o benderfyniadau pwysig mewn marchnadoedd ariannol yn symud yn fwyfwy gan oruchwyliaeth a rheolaeth ddynol. Mae masnachu algorithmig yn dod yn fwy poblogaidd, math o fuddsoddiad ariannol sy'n cael ei reoli'n llwyr gan dechnoleg. Ond mae llawer o'r penderfyniadau ariannol hyn yn cael eu heffeithio gan newyddion, trwy newyddiaduraeth sy'n dal i gael ei gyflwyno yn bennaf yn Saesneg. Mae tasg bwysig, felly, o NLP wedi dod â'r cyhoeddiadau testun plaen hyn, ac yn tynnu'r wybodaeth berthnasol mewn fformat y gellir ei ystyried mewn penderfyniadau masnachu algorithmig. Er enghraifft, gall newyddion o uno rhwng cwmnïau gael effaith fawr ar benderfyniadau masnachu, a'r cyflymder y gall manylion yr uno, chwaraewyr, prisiau, sy'n ennill pwy, gael eu hymgorffori mewn algorithm masnachu gael goblygiadau elw yn y miliynau o ddoleri.

04 o 05

Crynhoi

Mae gorlwytho gwybodaeth yn ffenomen go iawn yn ein hoedran ddigidol, ac mae ein mynediad at wybodaeth a gwybodaeth eisoes yn llawer uwch na'n gallu i ddeall. Mae hon yn duedd nad yw'n dangos unrhyw arwydd o arafu, ac felly mae gallu crynhoi ystyr dogfennau a gwybodaeth yn dod yn fwyfwy pwysig. Mae hyn yn bwysig nid yn unig yn ein galluogi i adnabod ac amsugno'r wybodaeth berthnasol o symiau helaeth o ddata. Canlyniad arall a ddymunir yw deall ystyron emosiynol dyfnach, er enghraifft, yn seiliedig ar ddata wedi'i gyfuno o'r cyfryngau cymdeithasol , a all cwmni benderfynu ar y teimlad cyffredinol am ei chynnig cynnyrch diweddaraf? Bydd y gangen hon o NLP yn dod yn gynyddol ddefnyddiol fel ased marchnata gwerthfawr.

05 o 05

Cwestiwn Ateb

Mae peiriannau chwilio yn rhoi cyfoeth o wybodaeth y byd ar y bysedd, ond maent yn dal i fod yn eithaf cyntefig yn gyffredinol o ran ateb cwestiynau penodol y mae pobl yn eu hwynebu. Mae Google wedi gweld y rhwystredigaeth a achosodd hyn gan ddefnyddwyr, sydd yn aml yn gorfod rhoi cynnig ar nifer o wahanol ganlyniadau chwilio i ddod o hyd i'r ateb y maent yn chwilio amdani. Ffocws mawr ymdrechion Google yn NLP yw cydnabod cwestiynau iaith naturiol, dethol yr ystyr, a darparu'r ateb, ac mae esblygiad tudalen canlyniadau Google wedi dangos y ffocws hwn. Er yn sicr yn gwella, mae hyn yn parhau i fod yn her fawr i beiriannau chwilio, ac un o brif geisiadau ymchwil prosesu iaith naturiol.