Sut i Defnyddio Offer 'Ngram Viewer' yn Google Books

Mae Ngram, a elwir yn aml yn N-gram yn ddadansoddiad ystadegol o destun neu gynnwys lleferydd i ganfod n (nifer) o ryw fath o eitem yn y testun. Gallai fod yn bob math o bethau, fel ffonemau, rhagddodiad, ymadroddion neu lythyrau. Er bod yr N-gram braidd yn aneglur y tu allan i'r ymchwilydd, fe'i defnyddir mewn amrywiaeth o feysydd, ac mae ganddo lawer o oblygiadau i bobl sy'n gwneud rhaglenni cyfrifiadurol sy'n deall ac yn ymateb gydag iaith lafar naturiol. Ychydig, yn fyr, fyddai diddordeb Google yn y syniad.

Yn achos Google Books Ngram Viewer, mae'r testun i'w dadansoddi yn dod o'r nifer helaeth o lyfrau y mae Google wedi eu sganio o lyfrgelloedd cyhoeddus i boblogi eu peiriant chwilio Google Books . Ar gyfer Google Books Ngram Viewer, maent yn cyfeirio at y testun rydych chi'n mynd i'w chwilio fel "corpus." Mae'r corfforol yn Ngram Viewer wedi'i rannu yn ôl iaith, er y gallwch chi ddadansoddi Saesneg Prydeinig ac America ar wahân neu eu cyfuno gyda'i gilydd. Mae'n gorffen yn ddiddorol iawn i symud o ddefnydd Prydain i America o delerau a gweld y siartiau'n newid.

Sut mae Ngram yn Gweithio

  1. Ewch i Google Books Ngram Viewer yn books.google.com/ngrams.
  2. Mae eitemau yn sensitif i achosion, yn wahanol i chwiliadau Google Google, felly gwnewch yn siŵr eich bod yn manteisio ar enwau priodol.
  3. Teipiwch unrhyw ymadrodd neu ymadroddion yr hoffech eu dadansoddi. Byddwch yn siŵr i wahanu pob ymadrodd gyda choma. Mae Google yn awgrymu, "Albert Einstein, Sherlock Holmes, Frankenstein" er mwyn i chi ddechrau.
  4. Nesaf, dewch i mewn i ystod dyddiadau. Y rhagosodiad yw 1800 i 2000, ond mae llyfrau mwy diweddar (2011 oedd y mwyaf diweddar a restrir ar ddogfennau Google, ond gallai hynny fod wedi newid.)
  5. Dewiswch corpus. Gallwch chwilio testunau iaith dramor neu Saesneg, ac yn ychwanegol at y dewisiadau safonol, efallai y byddwch yn sylwi ar bethau fel "Saesneg (2009) neu Saesneg America (2009)" ar y gwaelod. Mae'r rhain yn gorffora hŷn y mae Google wedi eu diweddaru ers hynny, ond efallai y bydd gennych ryw reswm i wneud eich cymariaethau yn erbyn hen setiau data. Gall y rhan fwyaf o ddefnyddwyr eu hanwybyddu a'u ffocysu ar y gorfforaeth mwyaf diweddar.
  6. Gosodwch eich lefel chwistrellu. Mae lliniaru yn cyfeirio at ba mor llyfn yw'r graff ar y diwedd. Y cynrychiolaeth fwyaf cywir fyddai lefel lleddfu o 0, ond efallai y bydd hynny'n anodd ei ddarllen. Mae'r gosodiad diofyn wedi'i osod i 3. Yn y rhan fwyaf o achosion, nid oes angen i chi addasu hyn.
  1. Gwasgwch y botwm Chwilio llawer o lyfrau . (Fe allwch chi ddim ond taro'r cofnod yn yr amser chwilio.)

Beth sy'n Ngram yn Dangos?

Bydd Google Books Ngram Viewer yn allbwn graff sy'n cynrychioli'r defnydd o ymadrodd arbennig mewn llyfrau trwy amser. Os ydych wedi rhoi mwy nag un gair neu ymadrodd, fe welwch linellau cod-liw i wrthgyferbynnu'r gwahanol dermau chwilio. Mae hyn yn eithaf tebyg i Google Tunds , dim ond y chwiliad sy'n cwmpasu cyfnod hirach o amser.

Dyma enghraifft o fywyd go iawn. Yr oeddem yn chwilfrydig am bethau finegr yn ddiweddar. Fe'u crybwyllir yn Laura Ingalls Wilder's Little House ar y gyfres Prairie , ond ni fyddem erioed wedi clywed am y fath beth. Yn gyntaf, gwnaethom ddefnyddio chwiliad gwe Google i ddysgu mwy am pasteiod finegr. Mae'n debyg, maen nhw'n cael eu hystyried yn rhan o fwyd Americanaidd y De ac fe'u gwneir o finegr. Maent yn gwrando ar ôl i amseroedd pan nad oedd gan bawb fynediad i gynnyrch ffres bob amser o'r flwyddyn. Ai dyna'r stori gyfan?

Fe wnaethon ni chwilio Google Ngram Viewer, ac mae yna rai sôn am y cerdyn yn gynnar ac yn hwyr yn y 1800au, llawer o sôn yn y 1940au, a nifer gynyddol o sôn yn ddiweddar (efallai rhywfaint o hwyliog). Wel, mae yna rai broblem gyda'r data ar lefel llechi o 3. Mae llwyfandir dros y crybwyll yn y 1800au. Yn sicr, nid oedd nifer gyfartal o gyfeiriadau o un cerdyn penodol bob blwyddyn am bum mlynedd? Yr hyn sy'n digwydd yw hynny oherwydd nad oes llawer o lyfrau wedi'u cyhoeddi yn ystod y cyfnod hwnnw, ac oherwydd bod ein data wedi'i osod yn llyfn, mae'n ystumio'r darlun. Yn ôl pob tebyg, roedd un llyfr a oedd yn sôn am gacen finegr, a dim ond er mwyn osgoi spike y cafodd ei gyfartaledd. Trwy osod y lliniaru i 0, gallwn weld bod hyn yn union yr achos. Mae'r canolfannau sbig ar 1869, ac mae yna darn arall yn 1897 a 1900.

Onid oedd neb yn sôn am fagin finegr gweddill yr amser? Mae'n debyg maen nhw'n siarad am y pasteiod hynny. Roedd ryseitiau tebygol yn hedfan dros y lle. Nid oeddent yn ysgrifennu amdanyn nhw mewn llyfrau, ac mae hynny'n gyfyngiad o'r chwiliadau Ngram hyn.

Chwiliadau Ngram Uwch

Cofiwch sut y dywedasom y gallai Ngrams gynnwys pob math o wahanol chwiliadau testun? Mae Google yn eich galluogi i ddileu ychydig yn weddol gyda'r Ngram Viewer hefyd. Os hoffech chi chwilio am bysgod y ferf yn lle pysgod yr enw, gallwch wneud hynny trwy ddefnyddio tagiau. Yn yr achos hwn, byddech chi'n chwilio am "fish_VERB"

Mae Google yn darparu rhestr gyflawn o orchmynion y gallwch eu defnyddio a dogfennau uwch eraill ar eu gwefan.