Innlent

Ó­trú­legar niður­stöður á augna­bliki

Kristín Ólafsdóttir skrifar

Ótrúlegar framfarir hafa orðið á texta- og myndgreiningarforritum síðustu misseri, að sögn sérfræðings í gervigreind. Forritin, sem mörg eru opin öllum, eru farin að geta framkallað magnaðar niðurstöður á skömmum tíma. En þau leysa þó ekki mennska listamenn af hólmi í bráð.

Uppgangur umræddra myndgreiningarforrita hefur vakið sérstaka eftirtekt og fögnuð netverja upp á síðkastið. Notandinn skrifar lýsingu á því sem hann vill, í myndskeiðinu hér fyrir ofan biður fréttamaður til dæmis um olíumálverk af Reykjavík að hausti, og eftir fáeinar sekúndur birtist afurðin. Mun betri en sú sem fréttamaður hefði getað skapað upp á gamla mátann - og á mun skemmri tíma.

Saga Úlfarsdóttir, forstöðumaður gervigreindar hjá Travelshift.Vísir/bjarni

Þessi forrit eru flókin; byggja á gríðarlegu magni mynda (sömu lögmál gilda raunar um texta) sem þegar er til á netinu og forritið lærir að þekkja.

„Og út frá því lærir það að búa til myndir eins og það sér umheiminn,“ segir Saga Úlfarsdóttir, forstöðumaður gervigreindar hjá tæknifyrirtækinu Travelshift. Þróunin hefur verið gríðarhröð.

„Á síðustu tveimur, þremur árum hafa komið fram gríðaröflug módel, kölluð generative models sem eru gerð með svokölluðum transformers, og við erum að sjá rosalega flottar niðurstöður á skömmum tíma,“ segir Saga.

„Við erum bara að sjá nýja öld af þessum hlutum.“

Donald Trump „mættur“ til Reykjavíkur

Til marks um þessa þróun má hér sjá túlkun fyrstu útgáfu eins vinsælasta forritsins, DALL-E, á Sigmundi Davíð Gunnlaugssyni dreypa á bjór og Bjarna Benediktssyni reykja sígarettu. Ákveðinn byrjendabragur á myndvinnslunni - en forritið þekkir þó greinilega mennina sem það er beðið um að túlka.

Eldri útgáfa DALL-E en sú sem nú er í loftinu gaf okkur þessi listaverk.

Fréttamaður spreytti sig svo áfram og lét nýjustu útgáfu af sambærilegu forriti, Midjourney, túlka eðlu á snjóbretti í íslensku landslagi, Donald Trump fá sér kokteil í Reykjavík og Seljalandsfoss á Mars. Niðurstöðurnar afar nákvæmar. Og tæknin er þegar farin að nýtast.

Forritið Midjourney bjó þessi listaverk til að beiðni fréttamanns; eðlu á snjóbretti á Íslandi, Seljalandsfoss á Mars og Donald Trump fá sér kokteil í Reykjavík.

„Fólk hefur búið til teiknimyndasögur. Ég þekki einn sem safnaði saman íslenskri list og þjálfaði módel. Og er þannig að búa til módel sem „representar“ íslenska list,“ segir Saga. 

En hvað þýðir þetta fyrir listamenn og textasmiði framtíðarinnar?

„Þetta er nú ekki alveg þar að þetta komi í staðinn fyrir þá. Og það er kannski mjög áhugavert hvað þetta hefur að segja um höfundarétt, því þessi gögn eru þjálfuð á öðrum gögnum sem eru opin. En hver á gögnin? Hver á myndina sem algóritminn bjó til?“

Ósköp að sjá hana, blessaða.

Ósjáleg túlkun nýjustu útgáfu DALL-E á íslenskri konu í handahlaupi á þilfari hér fyrir ofan er einmitt til marks um að tæknin er ekki orðin fullkomin. 

„Gallinn við þetta er að þú veist ekki á hverju þetta byggir, sérstaklega ef þetta er sett upp sem þjónusta sem fyrirtæki eiga. Þannig að þú gætir verið að byggja á einhverjum gögnum sem þú þekkir ekki neitt,“ segir Saga.




Fleiri fréttir

Sjá meira


×