Poseidon potrzebuje danych głosowych i wiarygodnej prawdy w terenie w językach o niskich zasobach, aby przeprowadzić benchmark. Aby zapewnić dokładność transkrypcji LLM, współpracowaliśmy z lingwistami, aby audytować wyniki w języku bengalskim. W przypadku języka, którym posługuje się 280 milionów ludzi, luki, które znaleźliśmy, wskazują na głębszy problem: dane ↓