
PL-Konwerter 1.16
===================

UNIWERSALNY KONWERTER POLSKICH ZNAKW
1997/98 (C) Dariusz Flaga
Wszelkie prawa zastrzeone.

Program jest przeznaczony do konwersji polskich znakw diakrytycznych w
dokumentach tekstowych (w tym take HTML). Obsuguje ponad 20-rnych
standardw, automatycznie identyfikuje format pliku wejciowego, posiada
moliwo zdefiniowania wasnego standardu, konwertuje wiele plikw na raz,
dokonuje przekodowywania plikw DOS / Unix.
Program udostpniany jest bezpatnie na zasadach freeware.

Moliwa jest konwersja pomidzy standardami:
  - ISO 8859-2 (PN-93/T-42118)
  - CP-1250 (MS Windows)
  - CP-852 (IBM Latin-2)
  - Mazovia
  - Microvex
  - Unia
  - Cyfromat
  - DHN
  - CSK
  - CorelDraw!
  - Ventura
  - ATM
  - Macintosh
  - Atari ST/TT (standard Calamus`a)
  - Amiga-PL
  - ELWRO-Junior
  - IINTE-ISIS
  - IEA-wierk
  - Logic
  - TeXPL 
  - dowolnym innym formatem zdefiniowanym przez uytkownika
  oraz do postaci Plain-ASCII (czyli bezogonkowych odpowiednikw).

Jest to chyba jeden z niewielu programw do konwersji polskich znakw jakie
powstay pod wzgldem uniwersalnoci, szybkoci, zaawansowania algorytmw i
iloci obsugiwanych formatw. Ponadto jego obsuga jest niezwykle prosta i
zgodna z oglnie znan konwencj "okienkow". Kompletny program zawarty jest
w jednym pliku i nie wymaga adnych dodatkowych bibliotek.

Celem autora nie byo stworzenie narzdzia czysto HTML`owego, ale programu
moliwie jak najbardziej uniwersalnego i uytecznego (nie znaczy to jednak,
e nie nadaje si do WWW - wrcz przeciwnie). Niezwykle duy nacisk zosta
pooony na prawidow i optymaln identyfikacj zastosowanej metody kodowania,
co biorc pod uwag ilo obsugiwanych standardw nie byo rzecz prost.
Poniewa program ten jest jedynie konwerterem (i takim mia by) nie ingeruje
w zawarto logiczn pliku (adnych zmian/dodawania dyrektyw meta-charset itp.)
poza konwersj polskich znakw nalecych do danego zestawu.

Program umoliwia wykonywanie konwersji wielu plikw na raz.
Wybr pliku/w do konwersji moe by dokonany tradycyjnie przez zaznaczenie
pliku/w w gwnym oknie programu (wybieranie wicej ni jednego zbioru z
wcinitym klawiszem Ctrl lub Shift), poprzez wykorzystanie mechanizmu
drag`n`drop, "upuszczenie" katalogu, pliku lub grupy plikw na ikon programu
(lub jego skrtu) umieszczon np. na pulpicie, uruchomieniu konwertera z menu
systemowego (prawy klawisz myszki -> Wylij do -> PL_Konverter) oraz przez
wywoanie programu z parametrem. Ta ostatnia metoda umoliwia proste
"podczenie" konwertera np. do programu wspomagajcego tworzenie stron WWW.
W przypadku przekazania katalogu wszystkie jego pliki (do pierwszego poziomu)
zostan zaznaczone. Nie brane s natomiast pod uwag dalsze podkatalogi.
Jak wida program jest niezwykle elastyczny i stwarza szerokie moliwoci dla
optymalnej obsugi w zalenoci od preferencji uytkownika.

Nie jest konieczne adne wczeniejsze tworzenie specjalnych list itp. a
konwertowany moe by dowolny plik - niezalenie od typu, dugoci jak i
zawartoci.

Po wybraniu interesujcych plikw naley przycisn odpowiedni przycisk
po prawej stronie okna okrelajcy nowy format do ktrego maj zosta
przekonwertowane zaznaczone zbiory.

Standard wejciowy moe by rozpoznawany zarwno automatycznie jak i rcznie
przez uytkownika.

Identyfikacja standardu odbywa si niezalenie dla kadego przetwarzanego
pliku na podstawie analizy jego zawartoci (a nie ewentualnych znacznikw
meta-charset). Charset jest rozwizaniem dobrym i przede wszystkim bardzo
szybkim, ale nie dajcym dobrych rezultatw chociaby w przypadku plikw
nie zawierajcych odpowiedniej dyrektywy meta (w tym zbiory tekstowe nie
HTML`owe) lub z bdnie ustawionym charset`em. Ograniczaoby to w sposb
znaczny moliwoci konwertera, a ponadto mogoby prowadzi do bdnej
identyfikacji i uszkodzenia zawartoci pliku. Zdecydowano si wic na
lepsz i bardziej uniwersaln, cho rozbudowan metod.

Najwicej czasu zajmuje pena identyfikacja uytego sposobu kodowania
(test pliku na przynaleno do kadej z 22 grup - kada po 18 znakw) i
wanie ona jest sygnalizowana odpowiednim wskanikiem. Sama konwersja
przebiega niezwykle szybko i nie jest dodatkowo sygnalizowana.
Moliwe jest uycie tzw. analizy skrconej, ktra daje bardzo dobre rezultaty,
a przy tym znacznie przyspiesza prac programu.

Jak ju wspomniano konwertowany moe by dowolny plik tekstowy (w tym rwnie
zbir HTML) bez wzgldu na dugo jak i zawarto. Rozpoznawanie sposobu
kodowania polskich znakw nastpuje po analizie struktury caego lub czci
pliku (do momentu jednoznacznego stwierdzenia formatu) i okreleniu
wspczynnikw prawdopodobiestwa przynalenoci do odpowiednich grup.

Poniewa niektre metody opieraj si na tych samych kodach w skrajnych
przypadkach nie bdzie moliwe jednoznaczne okrelenie formatu pliku.
Dzieje si tak na przykad dla standardw DHN i Logic oraz Cyfromat i
IINTE-ISIS, gdzie zbir kodw jest identyczny, natomiast ich znaczenie
jest rne (zamienione miejscami znaki: / oraz /).
Automatyczna identyfikacja nie okreli rwnie w sposb jednoznaczny formatu
pliku zawierajcego zbyt ma ilo kodw mogcych nalee do rnych grup w
przypadku, gdy rozpoznawany jest z jednakowo wysokim prawdopodobiestwem
wicej ni jeden standard. W obydwu wypadkach program wywietli list
najbardziej prawdopodobnych formatw i umoliwi uytkownikowi podjcie
wasnej decyzji.

I tak, jeeli dana metoda zostaa rozpoznana z najwikszym prawdopodobiestwem
i w dodatku nie mniejszym ni 95% rozpoczyna si konwersja. W przeciwnym
wypadku wymagane jest dodatkowe potwierdzenie chci przeprowadzenia konwersji
(niepewna identyfikacja). Ponadto algorytm dopuszcza pewien margines bdu <1%
dla znakw o kodach przypadkiem zgodnych z polskimi. Uodparnia to na bdn
identyfikacj np. pliku tekstowego zawierajcego pojedynczy znak (c) itp.
Dodatkowo zastosowano jeszcze kilka innych kryteriw podnoszcych
bezpieczestwo pracy programu.

Wszystkie progi decyzyjne zostay dobrane dowiadczalnie na podstawie szeregu
przeprowadzonych symulacji.

Bdnie interpretowane mog by pliki zawierajce dodatkowe informacje lece
w obszarach wystpowania polskich znakw lub w ktrych skad wchodzi kilka
rnych metod kodowania (w takim przypadku zostanie jednak wywietlony
stosowny komunikat). Midzy innymi z tego wzgldu istnieje opcja wyczajca
automatyczn identyfikacj, a format wejciowy okrela uytkownik.

Konwersji podlegaj jedynie znaki nalece do zidentyfikowanego pierwotnego
standardu - tote wszystkie inne pozostaj bez zmian.

Pliki nie zawierajce polskich znakw nie mog by konwertowane (przynajmniej
nie w tej wersji :-)

W programie przewidziano moliwo stworzenia dodatkowo wasnego standardu w
zalenoci od indywidualnych potrzeb uytkownika. W odpowiednich polach okna
konfiguracji naley wpisa dziesitnie kody znakw ASCII odpowiadajce
poszczeglnym znakom diakrytycznym. Jest to tzw. "standard uytkownika".

Oprcz konwersji polskich znakw moliwa jest translacja plikw pomidzy
platformami DOS i Unix (rnice w oznaczeniu koca linii CR,LF / LF).
Opcj t doceni zwaszcza uytkownicy Internetu...

Prawidowe przeprowadzenie konwersji nie jest dodatkowo sygnalizowane.
Komunikaty pojawiaj si jedynie w przypadku akcji wymagajcych podjcie
decyzji przez uytkownika.

Dwukrotne kliknicie na nazwie pliku w oknie programu powoduje jego otwarcie
domylnie w Notepadzie. Nacinicie prawego przycisku myszki spowoduje
rozwinicie menu umoliwiajce wysanie zaznaczonego pliku/w do wybranego
wczeniej edytora lub przegldarki HTML.

Program nie wymaga specjalnej instalacji. Przy pierwszym uruchomieniu zostaj
ustawione default`owe parametry pracy. Za kadym razem przy wyjciu z programu
zostaje zapamitane pooenie ostatnio konwertowanych plikw, tak e ponowne
jego uruchomienie odbdzie si w ostatnio uywanym katalogu.
Opcja "Usu" z okna ustawie usuwa wszelkie informacje konfiguracyjne z
rejestru systemowego oraz skrty z pulpitu i menu kontekstowego, nie kasuje
natomiast samego programu.


Parametry konfigurowalne:
===========================
Ze wzgldw bezpieczestwa moliwe jest tworzenia kopii zapasowych.
Wwczas kady konwertowany plik przed wprowadzeniem jakichkolwiek zmian
bdzie zapisany z rozszerzeniem [*.bak].

Zachowanie daty i czasu konwertowanego pliku. Jeeli ta opcja jest wczona
kady plik po konwersji bdzie mia niezmienion dat i czas ostatniej
modyfikacji, w przeciwnym razie zostanie ustawiony czas przeprowadzenia
konwersji.

Automatyczna identyfikacja pliku wejciowego. Jeeli opcja ta jest wyczona
informacj o wejciowym formacie podaje uytkownik.

Szybka (skrcona) identyfikacja formatu - przeprowadzana a do jednoznacznego
zidentyfikowania formatu pliku wejciowego.

Rozpoznawanie standardu uytkownika. Ze wzgldu na dowolno kodw standardu
uytkownika zaleca si wyczenie tej opcji.

Skrt programu na pulpicie - wczenie lub wyczanie obecnoci skrtu.

Opcja konwersji w menu systemowym - dostpna prawym przyciskiem myszki w
grupie "Wylij do".

Wybr edytora (lub innego programu) uruchamianego prawym przyciskiem myszki
z listy plikw.

Kady z wymienionych parametrw jest ustawiany w oknie konfiguracyjnym i
odtwarzany przy kadym uruchomieniu programu.


-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-

Freeware

Autor programu zezwala na jego bezpatne uywanie, dowolne kopiowanie i
rozpowszechnianie w oryginalnej postaci wraz z pen dokumentacj zgodnie
z zasadami freeware.
Nie udziela natomiast zgody na pobieranie jakichkolwiek opat (poza
ewentualnymi niezbdnymi kosztami publikacji) oraz rozprowadzanie tego
programu lub jego czci wraz z innymi komercyjnymi produktami bez zgody
autora. Opisywany program jest udostpniony w formie "as is" bez adnych
gwarancji, zobowiza i odpowiedzialnoci za jego poprawne dziaanie.

Poniewa program jest cigle rozbudowywany zapraszam do odwiedzania mojej
strony WWW, na ktrej publikowane bd kolejne nowe jego wersje.


1998 (C) Dariusz Flaga
e-mail: dflaga@elka.pw.edu.pl
http://home.elka.pw.edu.pl/~dflaga



Historia powstawania konwertera:

DOS:
	1.0  1994	- 16 standardw
	2.0  1995	- 21 standardw

Windows 3.1x:
	1.0   06.1997	- nie wysza "na zewntrz"
	1.10  08.1997	- pierwsza wersja udostpniona w internecie

Windows 95/NT:
	1.14B 03.1998	- rozbudowany algorytm detekcji formatu
			- przyspieszona identyfikacja
			- setup
			- kopie zapasowe
			- zachowanie daty i czasu pliku
			- poczenie z Notepad`em
	1.15  05.1998	- wprowadzony standard uytkownika
			- konwersja pomidzy DOS a Unix
			- poprawiony drag`n`drop
			- obsuga skrtu na pulpicie
			- aktywny link na WWW i e-mail
	1.16  06.1998	- popupmenu: edytor uytkownika, HTML browser
			- przyspieszony algorytm skrconej autodetekcji
			- poprawiony bd wywietlania standardu uytkownika

Jeeli uwaasz, e program speni Twoje oczekiwania lub masz do
niego jakie uwagi (take krytyczne) podziel si nimi z autorem.
Dziki Tobie ten program MOE by jeszcze lepszy!

Jeeli udostpniasz niniejszy program publicznie w internecie powiniene
zaczy na stronie jego logo i link na odpowiedni podstron autora.


_______

All trademarks are trademarks and are owned by their owners of course.
