Czym jest plik GEDCOM?
To zwykły plik tekstowy, który podobnie jak pliki HTML, zawiera kilka sekcji oraz znaczniki wskazujące, czego dotyczą określone informacje. W pliku GEDCOM każdy wiersz zawiera pojedynczą informację. Podobnie jak w przypadku HTML, pliku GEDCOM nie tworzy się ręcznie - znacznie częściej jest przygotowywany w programach genealogicznych.
Oto taki plik. Jest cokolwiek uproszczony, ale w pełni zgodny ze standardem. Zawiera dokładnie te same informacje, które podałem w liście na wstępie:
0 HEAD 1 SOUR PAF 2 NAME Personal Ancestral File 2 VERS 5.2.18.0 1 DATE 1 Feb 2004 2 TIME 14:54:41 1 FILE jozef-londzin.ged 1 GEDC 2 VERS 5.5 2 FORM LINEAGE-LINKED 1 CHAR ANSI
0 @SUB1@ SUBM 1 NAME Tomasz Nitsch 1 EMAIL admin@genpol.com
0 @I1@ INDI 1 NAME Józef /Londzin/ 2 SURN Londzin 2 GIVN Józef 1 SEX M 1 BIRT 2 DATE 3 Feb 1862 2 PLAC Zabrzeg 74 1 CHR 2 DATE 6 Feb 1862 2 PLAC Zabrzeg 1 DEAT 2 DATE 21 Apr 1929 2 PLAC Cieszyn 1 FAMC @F1@
0 @I2@ INDI 1 NAME Józef /Londzin/ 1 FAMS @F1@
0 @I3@ INDI 1 NAME Katarzyna /Kuboszek/ 1 FAMS @F1@
0 @F1@ FAM 1 HUSB @I2@ 1 WIFE @I3@ 1 CHIL @I1@
0 TRLR
Tak przygotowany plik przesyłamy naszemu korespondentowi.
Jak widać, format jest wręcz banalny i jeśli plik zawiera informacje na temat rodziców i jednego dziecka, wręcz nie potrzeba żadnego programu, aby zrozumieć, o co chodzi. Sprawa staje się trudniejsza, jeżeli w bazie mamy setki czy tysiące osób. Problematyczne staje się również czytanie pliku bez znajomości podstaw angielskiego. Znaczniki formatu GEDCOM (podobnie jak wielu innych) są zredagowane w tym języku. Masz jednak do dyspozycji cały zestaw narzędzi, które pomogą przeczytać tak przesłane dane.
Podstawową zasadą zapisu jest grupowanie informacji, wyznaczane przez pierwszą cyfrę w każdym wierszu. I tak nagłówek pliku zaczyna się od 0 HEAD (header - nagłówek) i kończy się na kolejnym wierszu zaczynającym się od 0, czyli 0 @SUB1@ SUBM. Analogicznie informacje dotyczące narodzin zaczynają się od 1 BIRT i wszystkie wiersze aż do następnego rozpoczynającego się od 1 (w naszym przypadku 1 CHR) dotyczą narodzin - 2 DATE 3 Feb 1862 to data narodzin, a 2 PLAC Zabrzeg 74 to ich miejsce.
Najważniejsze sekcje poziomu 0 pliku GEDCOM to:
HEAD - informacje ważne dla technologów, a więc nazwa i wersja oprogramowania, które posłużyło do utworzenia pliku, kilka informacji technicznych oraz - co szczególnie ważne - data wygenerowania pliku;
SUBM - informacje kontaktowe osoby, która wygenerowała plik - w domyśle osoby, która zebrała informacje;
INDI - każda sekcja stanowi opis pojedynczej osoby;
FAM - każda sekcja stanowi opis jednej rodziny;
TRLR - zakończenie pliku.
Oprócz wymienionych informacji pliki GEDCOM mogą zawierać mnóstwo innych szczegółów, takich jak źródła danych, informacje multimedialne (zdjęcia, wideo) itd.
Jak już wspomniałem, czasami zdarzają się znaczniki niezgodne z formatem. Jeżeli oprogramowanie nie rozpozna znacznika, to albo ignoruje taki wiersz, albo umieszcza dane w nim zawarte w specyficznym polu, aby można je było następnie przenieść ręcznie w inne, odpowiednie pola.
Paweł Wimmer "stankiewicz.e.pl/forum/viewtopic.php?t=451"
|