számítógépes fordítás címkével jelölt bejegyzések

Sorok között olvasni – az urdu twitekben

Érdekes hír jelent meg a National Public Radio honlapján:

http://www.npr.org/2011/04/05/135049784/computer-translator-reads-between-the-tweets

Rohini Srihari, a University of Buffalo kutatója kifejlesztett egy olyan számítógépes programot, ami állítása szerint hatékonyabban fordít urduról, mint a korábban elérhető, statisztikai eszközöket használó eszközök. Az urdu Pakisztán egyik hivatalos nyelve, összesen 65 millióan beszélik (Indiában öt államban szintén hivatalos nyelv), akik szinte mind muszlimok.

Twitter-bejegyzések értelmezésére készült a program, mert itt lehet leginkább naprakész (vagy még annál is frissebb), első kézből származó információt szerezni az Amerikát igencsak érdeklő területről, és ezért nem is meglepő, hogy a Pentagon anyagilag támogatja a projektet.

A kutató legfőbb célja az volt, hogy megtudja, milyen érzelmeket fejeznek ki a Twitter urdu nyelvű bejegyzései egy adott témával kapcsolatban. A program pirossal jelzi, ha negatív szövegösszefüggésben említenek valamit, míg zölddel azt, amikor pozitív dolgokat mondanak róla.