Reporter

Cofnij
Strona główna
Poprzedni artykułNastępny artykuł
 


-= WARSZTAT =-
Reporter nr 7 - 1999.07.25 Paweł Podolski

Mówiące komputery

Ponieważ jest to mój pierwszy artykuł, który mam zaszczyt opublikować w Reporterze, więc może napiszę kilka słów o sobie. Nazywam się Paweł Podolski. Mam 22 lata. Jestem osobą niewidomą, która komputerem posługuje się już od siedmiu lat. Niektórzy z Was za pewno się uśmiechnęli i pytają: jak to możliwe, aby ktoś taki jak ja mógł pracować na komputerze, skoro nie widzi, co się pojawia na ekranie? Czy on mówi poważnie? Przeczytaj ten artykuł, a przekonasz się, że tak.

Gdy ktoś mi zadaje powyższe pytanie, a wiem, że z komputerami nie miał nic wspólnego, albo bardzo niewiele o nich wie, odpowiadam, że skoro Mahomet nie mógł przyjść do góry, więc góra musiała przyjść do Mahometa. Musiałem po prostu nauczyć komputer mówić. Rozmowa człowieka z maszyną pozostaje nadal w sferze naszych marzeń, ale już dziś synteza mowy nie jest czymś zaskakującym. Dzięki mowie syntetycznej komputer służy mi jako lektor, informując czego ode mnie chce. Dzięki temu mogę czytać, pisać, a czasami świetnie się bawić.

No dobrze, dobrze, już będę poważny i postaram się Państwu przedstawić możliwości niewidomych przy pracy z komputerem. Omówię głównie pracę w Windows'ach, gdyż bez tego dzisiaj ani rusz, niemniej jednak większość niewidomych, którzy używają komputerów do pracy lub zabawy na co dzień korzysta jednak ze środowiska znakowego. Wynika to głównie z faktu, że znacznie prościej jest napisać screenreader (czyli program, który monitoruje przez cały czas system operacyjny i "czyta" niewidomemu to, co w danym momencie najważniejszego dzieje się na ekranie) dla środowiska DOS, który współpracuje z programami działającymi w trybie tekstowym, niż program spełniający taką samą funkcję dla systemu Windows, w którym jak wiadomo, oprócz tekstu mamy także różnego rodzaju elementy graficzne, jak ikony przyciski itd.

Jednym z popularniejszych programów udźwiękowiających pracę komputera w trybie znakowym jest "Readboard" warszawskiej firmy Altix. Jego zaletą jest to, że pozwala na pracę z większością programów, które działają w trybie tekstowym. Problemy występują tylko przy programach rezydentnych, które uaktywnia się przez naciśnięcie jakiejś kombinacji klawiszy. Poza tym jest on prosty w obsłudze i pozwala na łatwe dostosowywanie go do potrzeb programu, z którym aktualnie pracujemy. W przypadku gdy używamy niewielkiej liczby programów, nie ma to właściwie żadnego znaczenia, gdyż do kilku programów, zawsze przy pomocy osoby widzącej można dostosować screenreader do swoich potrzeb, a następnie na dysku zapisać, jak ma się on zachowywać, gdy uruchomimy na przykład Norton Commander'a lub ulubiony edytor tekstów. Gdy jednak ogląda się dużo różnych programów, nie zawsze można liczyć na pomoc osoby widzącej, która opisze wygląd ekranu.

Readboard właśnie dzięki swojej prostocie obsługi pozwala na pracę z różnymi programami, bez uciekania się do pomocy osób trzecich. Ma on jednak jedną poważną wadę. Napisany jest w Pascalu, co powoduje, że zajmuje dużo pamięci operacyjnej i czasami lubi się zawieszać. Synteza mowy jest w nim realizowana programowo, dzięki czemu, aby z nim pracować wystarczy prosty syntezatorek mowy oparty na covoksie podłączanym do portu równoległego. Jest dostępna również jego specjalna wersja, która działa z syntezatorem apollo, który jest jednym z najpopularniejszych sprzętowych syntezatorów mowy na świecie, gdyż pozwala na pracę z wieloma językami, co stwarza możliwość zatrudniania niewidomych na przykład przy tłumaczeniu tekstów.

Kolejnym programem, który umożliwia pracę w dosie jest program "Scr" warszawskiej firmy Emtron. Działa z syntezatorem mowy smp2 (skrót od system mowy polskiej). Jest to polski produkt, który jest tańszy od syntezatora Apollo, a mowa, którą generuje, w niczym mu nie ustępuje. Program "Scr" jest napisany w asemblerze, co powoduje, że jest stabilny, zajmuje mało pamięci operacyjnej i nie wiesza się. Komendy wydaje się mu za pomocą brajlowskiej klawiatury, która jest emulowana na zwykłej klawiaturze komputerowej. Dla przykładu, aby syntezator przeczytał cały ekran, należy napisać brajlowskie ę przez jednoczesne naciśnięcie klawiszy s k l.

Niech przemówi Windows.

Praktycznie nie jest możliwe napisanie screenreadera, który będzie działał ze wszystkimi programami w środowisku Windows. Wynika to z faktu, że jest to system graficzny, który owszem, ułatwia pracę widzącym, ale potrafi znacznie utrudnić lub niekiedy wręcz uniemożliwia pracę niewidomym. Fakty są takie, że bez odpowiedniego oprogramowania niewidomy nie jest w stanie samodzielnie pracować w środowisku graficznym. Gdy jednak ma screenreadera, jest praktycznie w stanie konkurować z osobą w pełni sprawną. Może zabrzmi to trochę dziwnie, ale czasami potrafi niektóre rzeczy zrobić nawet dokładniej. System Windows jest jednak niekiedy bardzo nieprzyjazny dla niewidomych, właśnie z uwagi na jego graficzny charakter i na fakt, że nie wszystko można zrobić w nim z klawiatury.

Są dwie szkoły, według których działają programy udźwiękowiające Windows. Jedna mówi, że program taki powinien działać najlepiej jak to możliwe z samym systemem operacyjnym oraz z najpopularniejszymi jego aplikacjami takimi jak Word, Excel i parę innych najczęściej używanych. Przykładem programu, który został napisany w myśl tej zasady jest program "Hal dla Windows 95" lub program "Wineyes". Charakterystyczną cechą "Hala dla Windows 95" jest wbudowana angielska mowa syntezowana przy użyciu karty dźwiękowej, co przydaje się, gdy ktoś pracuje w większości z angielskim systemem operacyjnym i angielskimi aplikacjami. Program "Hal dla Windows 95" może jednak czytać po polsku pod warunkiem zastosowania syntezatora mowy Apollo2 z wbudowanym modułem do syntezy mowy polskiej.

Druga szkoła zaś mówi, że screen reader musi działać z większością spotykanych na rynku programów. Nie zawsze jest to wykonywalne, gdyż niektóre programy posługują się niestandardowym interfejsem użytkownika i screenreader nie wie, co należy powiedzieć. W większości przypadków taki screenreader świetnie zdaje egzamin i pozwala w sposób prosty dopasowywać się do aktualnie uruchomionych aplikacji. Jednym z takich programów jest program "Outspoken", którego dzięki uprzejmości Akademii Górniczo-Hutniczej w Krakowie oraz Banku Austriackiego mogę używać. "Outspoken for Windows 2.01", przeznaczony dla Windows 3.1/3.11 i Windows 95/98, używa komend zlokalizowanych na klawiaturze numerycznej i na linijce brajlowskiej, jeśli jest podłączona do komputera, do czytania menu, pól dialogowych, ikon, pasków narzędzi, tekstu standardowego i innych.

"Outspoken" za pomocą mowy syntetycznej i braila pozwala używać wszystkich wbudowanych funkcji Windows takich, jak klawisze skrótów, komendy tab i klawisze kursorów oraz specjalnych funkcji dla inteligentnego przeglądania zawartości ekranu. "Outspoken" jest kompletnym interfejsem do programów, takich jak bazy danych, arkusze kalkulacyjne, edytory tekstu, gier i cd- romów. Możliwości programu zawierają automatyczne czytanie pojawiającego się okna i pól dialogowych, bardzo wygodną funkcję szukaj, czytanie kolumn i tytułów pól, informowanie o poruszaniu się po pustych obszarach, anonsowanie klawiszy skrótu i zestawy różnych głosów w celu odróżnienia grafiki, bieżącego fokusu i tekstu.

Aby używać "Outspoken" z mową syntetyczną powinieneś zaopatrzyć się w syntezator mowy lub oprogramowanie i kartę dźwiękową (w przypadku programów "Textassist", "Lektor" lub "Syntalk Sapi"). Jeżeli chodzi o grafikę "Outspoken" pozwala na jej nazywanie. Można do tego celu wykorzystać pojawiające się napisy pod ikonkami lub innymi symbolami graficznymi, w przeciwnym przypadku potrzebna jest pomoc osoby widzącej. Ja otrzymuję tylko informację, że dany obiekt na ekranie to obrazek, nie wiem jednak ani co to jest, ani do czego on służy. Nie oznacza to jednak, że gdy nie mam "ponazywanej" grafiki nie mogę normalnie pracować. Przy pracy w Windows'ach jak najwięcej staram się korzystać z klawiatury.

Myszy praktycznie nie używam, gdyż jest to niemożliwe z dwóch powodów. Po pierwsze myszka porusza się po ekranie w sposób płynny, co utrudnia mi orientację na ekranie. Po drugie, ponieważ nie widzę, nie mogę śledzić kursora myszy. Korzystając z klawiatury poruszamy się w sposób skokowy na przykład od jednego polecenia w menu do drugiego lub pomiędzy ikonkami, przyciskami lub po tekście. Jak wiadomo nie wszystko w Windows'ach można zrobić z klawiatury. W takim przypadku "Outspoken" daje mi do dyspozycji "wirtualną mysz", emulowaną z klawiatury numerycznej. Mogę więc poruszać się po grafikach, słowach, przyciskach i innych elementach przez naciśnięcie czwórki numerycznej (skok o jeden element w lewo) lub szóstki numerycznej (skok o jeden element w prawo). Piątka i dziewiątka odpowiadają kliknięciu lewym lub prawym przyciskiem myszy. No i jeszcze jedna ważna sprawa. "Outspoken" jest spolszczony. Jest to o tyle istotne, że zawsze gdy najadę kursorem na jakiś element mam informację, co to jest czyli na przykład przycisk, ikona, pole dialogowe i tak dalej.

Mając do dyspozycji komputer, syntezator mowy, screenreadera, skaner i program do rozpoznawania pisma jestem w stanie korzystać z materiałów drukowanych jak gazety, książki i inne. Czy potrafisz sobie wyobrazić, co by było, gdybyś nie mógł czytać? Jeśli tak, to wiesz jakie nieocenione usługi może oddać mi skaner z programem do rozpoznawania pisma.

Oprogramowanie, które opisałem stwarza dodatkowe możliwości zatrudnienia dla niewidomych. Niestety jest ono bardzo drogie. Koszt programu "Outspoken" wraz z syntezatorem mowy apollo2 wynosi około siedmiu tysięcy złotych. Nic więc dziwnego, że tak niewielki procent niewidomych w Polsce może pracować w Windows'ach. Większość radzi sobie w ten sposób, że ściągają z Sieci wersje demonstracyjne screenreaderów. Jeśli chcesz zaskoczyć swoich znajomych pokazując im "gadający Windows" zajrzyj na podane niżej strony WWW, gdzie znajdziesz wersje demonstracyjne programów "Outspoken" oraz "Syntalk Sapi", który posłuży Ci jako syntezator mowy, jeśli masz kartę dźwiękową zgodną z SoundBlasterem 16. Najpierw musisz zainstalować "Syntalk Sapi", a następnie "Outspoken'a", wybierając z listy syntezatorów mowy Microsoft Sapi lub Syntalk.

Szkoda tylko, że pracodawcy nie chcą dostrzec tych dodatkowych możliwości tkwiących w osobach niewidomych i nie dają szansy zaprezentowania się i pokazania własnych umiejętności. Wiem to z własnego doświadczenia. A szkoda, bo niewidomi to naprawdę świetni i rzetelni pracownicy.

Nie sposób w tak krótkim artykule omówić wszystkich możliwości, zalet i wad programów umożliwiających pracę na komputerze osobom niewidomym. Gdybyś chciał się dowiedzieć czegoś więcej na ten temat, możesz do mnie napisać: yxpodols@cyf-kr.edu.pl (także tradycyjnym listem - 31-510 Kraków, ul. Rakowicka 35/3) lub zadzwonić: (0-12) 412 41 44. Czasami jednak możesz trochę poczekać na odpowiedź, gdyż nie mam stałego dostępu do Internetu. Korzystam z niego dzięki uprzejmości mojego kolegi, który służy mi jako lektor, odczytując korespondencję i wyszukując potrzebne informacje.

Mam jeszcze jedną prośbę. Zbieram numery telefonów zaczynające się od cyfr 0-800 oraz wykorzystane karty telefoniczne. Jeśli masz jakieś infolinie, wiesz, gdzie na Internecie można znaleźć pliki dźwiękowe mid, moduły oraz mp3, wiesz, gdzie można znaleźć oprogramowanie narzędziowe, użytkowe i diagnostyczne pod Dos i Windows, znasz jakieś inne ciekawe miejsca na Sieci, do których Twoim zdaniem warto zajrzeć, masz jakieś zeskanowane książki lub coś, co warto przeczytać w plikach tekstowych, napisz do mnie.

+ OUTSPOKEN 2.0 - - www.alva-bv.nl/software/osw2demo.exe
+ SYNTALK SAPI 1.5 - www.neuro.pl/gratis/st15demo.exe

[spis treści][do góry]