Poseidon tarvitsee äänidataa ja luotettavaa perustotuutta vähäresurssisilla kielillä vertailua varten. Varmistaaksemme LLM:n transkription tarkkuuden teimme yhteistyötä kielitieteilijöiden kanssa tarkastaaksemme bengalinkieliset tuotokset. Kielessä, jota puhuu 280 miljoonaa ihmistä, löytämämme aukot viittaavat syvempään ongelmaan: data ↓