Ótrúlegt hve hratt Google lærði íslensku Breki Logason skrifar 3. september 2012 22:51 Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón. Mest lesið Krefjast gæsluvarðhalds Innlent Vaktin: Fannst þungt haldinn í Gufunesi og lést skömmu síðar Innlent Lögregla lýsir eftir manni Innlent Stórfelldur laxadauði í Berufirði Innlent Lýsir ofríki og andlegu ofbeldi Gunnars Smára Innlent Rannsókn lögreglu enn á frumstigi Innlent Rússar gefa lítið fyrir niðurstöðu fundar Bandaríkjanna og Úkraínu Erlent Framstuðarinn horfinn í morgun: „Ég á enga óvini svo ég viti til“ Innlent Hörfa frá Kúrsk Erlent Mætt í sína fyrstu opinberu heimsókn innanlands Innlent Fleiri fréttir Leikarar og dansarar á leið í verkfall Bein útsending: Blaðamannaverðlaunin afhent Tekið á móti nýju hafrannsóknaskipi Taldir hafa nýtt sér óvissu um starfsemi Zuism til þess að svíkja út fé Ögurstund upp runnin hjá VR Skjálftahrina við Reykjanestá Lýsir ofríki og andlegu ofbeldi Gunnars Smára Samþykkt að fella 700 til 900 tré í næsta áfanga Ráðherra mátti sín lítils gegn ríkinu Fangelsisdómar Zúistabræðra staðfestir Lögregla lýsir eftir manni Bæjarfulltrúum í Suðurnesjabæ fækkað um tvo Bindur vonir við að aukið fjármagn fáist í viðhald fyrir vestan Ekki meira en 350 grömm af rauðu kjöti á viku og sem minnst af sykri Lögregla segir rannsókn manndrápsins enn á frumstigi Rannsókn lögreglu enn á frumstigi Mætt í sína fyrstu opinberu heimsókn innanlands Mæla gegn því að ungbörn séu hnykkt Bein útsending: Landlæknir endurskoðar ráð sín um mataræði Krefjast gæsluvarðhalds Almyrkvi á tungli snemma á föstudagsmorgun Stórfelldur laxadauði í Berufirði Tveir kaflar að Látrabjargi lagfærðir fyrir almyrkvann Svefnlyf ávanabindandi og auki hættu á heilabilun Framstuðarinn horfinn í morgun: „Ég á enga óvini svo ég viti til“ Vinna hafin við nýja göngubrú í Vogahverfinu „Núna reynir auðvitað á Rússa“ Nokkur hinna handteknu tengjast tálbeituhópum Manndráp, varnardrónar og umferðaröngþveiti við Látrabjarg Vaktin: Fannst þungt haldinn í Gufunesi og lést skömmu síðar Sjá meira
Í síðasta mánuði gátu Íslendingar byrjað að tala íslensku við Google leitarvélina. Fyrrverandi starfsmaður fyrirtækisins og lektor við Háskólann í Reykjavík eru mennirnir á bakvið hugmyndina, sem þeir segja í upphafi hafa verið líkasta draumi. Í raun sé ótrúlegt hversu fljótt þeir náðu að kenna íslenskuna. Hingað til hefur það ekki talist neitt tiltökumál að tala íslensku í símann. Þannig hefur maður getað rætt við vini og vandamenn um nánast hvað sem er á hinu ástkæra og ylhýra. En nú getur maður talað íslensku við internetið í símanum. Þannig getur maður spurt sjálfan Google um nánast hvað sem er. Þetta eru þeir Trausti og Jón. Mennirnir á bakvið tungumálakunnáttu Google, sem nú í ágúst byrjaði að skilja íslensku. Íslenska er ekki beint efst á lista hjá Google en Trausti var þar starfsmaður og ýtti á eftir sínu móðurmáli. Hann leitaði til Jóns sem í samvinnu við fleiri hóf söfnun á íslenskum setningum. „Fyrst létum við einhverja fá síma og vonuðumst til að þeir söfnuðu. Það gekk voða hægt. Svo sátum við fyrir gestum og gangandi hérna í HR og veiddum inn fólk. Þá gekk þetta aðeins," segir Jón Guðnason, lektor við HR. en það komst ekki skriður á söfnunina fyrr en fyrirtæki og stofnanir hoppuðu um borð. Á endanum voru þetta um 230 þúsund setningar sem söfnuðust hjá rúmlega 500 manns. Íslenskan virkar vel að sögn strákanna en þeir vildu fá eins marga og þeir gátu til þess að tala eins fjölbreytt íslenskt mál og hægt er. Tölvan lærir síðan nokkurskonar meðaltals íslensku, og þjálfar sig í að tengja hljóð og texta. Og þeir eru óneitanlega stoltir. „Ég er búinn að vera í talgreiningu núna í 15 ár. Gerði fyrst talgervil. Þetta var lokatakmarkið. Ég vildi ekki fara frá Google fyrr en þetta yrði að veruleika," segir Trausti Kristjánsson, stofnandi. „Við erum með svona svipaðan bakgrunn við Trausti. Ég var í svona svipuðum sporum og hann. Þetta var draumur þegar maður kom út úr meistaranámi og eitthvað sem maður ætlaði að vinna að. Talgreining var augljóslega komin af stað. En það að ná talgreiningu fyrir íslensku var bara fjarlægur draumur. Og það er í raun bara ótrúlegt hvað við náðum þessu á stuttum tíma," segir Jón.
Mest lesið Krefjast gæsluvarðhalds Innlent Vaktin: Fannst þungt haldinn í Gufunesi og lést skömmu síðar Innlent Lögregla lýsir eftir manni Innlent Stórfelldur laxadauði í Berufirði Innlent Lýsir ofríki og andlegu ofbeldi Gunnars Smára Innlent Rannsókn lögreglu enn á frumstigi Innlent Rússar gefa lítið fyrir niðurstöðu fundar Bandaríkjanna og Úkraínu Erlent Framstuðarinn horfinn í morgun: „Ég á enga óvini svo ég viti til“ Innlent Hörfa frá Kúrsk Erlent Mætt í sína fyrstu opinberu heimsókn innanlands Innlent Fleiri fréttir Leikarar og dansarar á leið í verkfall Bein útsending: Blaðamannaverðlaunin afhent Tekið á móti nýju hafrannsóknaskipi Taldir hafa nýtt sér óvissu um starfsemi Zuism til þess að svíkja út fé Ögurstund upp runnin hjá VR Skjálftahrina við Reykjanestá Lýsir ofríki og andlegu ofbeldi Gunnars Smára Samþykkt að fella 700 til 900 tré í næsta áfanga Ráðherra mátti sín lítils gegn ríkinu Fangelsisdómar Zúistabræðra staðfestir Lögregla lýsir eftir manni Bæjarfulltrúum í Suðurnesjabæ fækkað um tvo Bindur vonir við að aukið fjármagn fáist í viðhald fyrir vestan Ekki meira en 350 grömm af rauðu kjöti á viku og sem minnst af sykri Lögregla segir rannsókn manndrápsins enn á frumstigi Rannsókn lögreglu enn á frumstigi Mætt í sína fyrstu opinberu heimsókn innanlands Mæla gegn því að ungbörn séu hnykkt Bein útsending: Landlæknir endurskoðar ráð sín um mataræði Krefjast gæsluvarðhalds Almyrkvi á tungli snemma á föstudagsmorgun Stórfelldur laxadauði í Berufirði Tveir kaflar að Látrabjargi lagfærðir fyrir almyrkvann Svefnlyf ávanabindandi og auki hættu á heilabilun Framstuðarinn horfinn í morgun: „Ég á enga óvini svo ég viti til“ Vinna hafin við nýja göngubrú í Vogahverfinu „Núna reynir auðvitað á Rússa“ Nokkur hinna handteknu tengjast tálbeituhópum Manndráp, varnardrónar og umferðaröngþveiti við Látrabjarg Vaktin: Fannst þungt haldinn í Gufunesi og lést skömmu síðar Sjá meira