Tatiana - 2008-01-12 22:24:36

Czym jest plik GEDCOM?

To zwykły plik tekstowy, który podobnie jak pliki HTML, zawiera kilka sekcji oraz znaczniki wskazujące, czego dotyczą określone informacje. W pliku GEDCOM każdy wiersz zawiera pojedynczą informację. Podobnie jak w przypadku HTML, pliku GEDCOM nie tworzy się ręcznie - znacznie częściej jest przygotowywany w programach genealogicznych.

Oto taki plik. Jest cokolwiek uproszczony, ale w pełni zgodny ze standardem. Zawiera dokładnie te same informacje, które podałem w liście na wstępie:

0 HEAD
1 SOUR PAF
2 NAME Personal Ancestral File
2 VERS 5.2.18.0
1 DATE 1 Feb 2004
2 TIME 14:54:41
1 FILE jozef-londzin.ged
1 GEDC
2 VERS 5.5
2 FORM LINEAGE-LINKED
1 CHAR ANSI

0 @SUB1@ SUBM
1 NAME Tomasz Nitsch
1 EMAIL admin@genpol.com

0 @I1@ INDI
1 NAME Józef /Londzin/
2 SURN Londzin
2 GIVN Józef
1 SEX M
1 BIRT
2 DATE 3 Feb 1862
2 PLAC Zabrzeg 74
1 CHR
2 DATE 6 Feb 1862
2 PLAC Zabrzeg
1 DEAT
2 DATE 21 Apr 1929
2 PLAC Cieszyn
1 FAMC @F1@

0 @I2@ INDI
1 NAME Józef /Londzin/
1 FAMS @F1@

0 @I3@ INDI
1 NAME Katarzyna /Kuboszek/
1 FAMS @F1@

0 @F1@ FAM
1 HUSB @I2@
1 WIFE @I3@
1 CHIL @I1@

0 TRLR

Tak przygotowany plik przesyłamy naszemu korespondentowi.

Jak widać, format jest wręcz banalny i jeśli plik zawiera informacje na temat rodziców i jednego dziecka, wręcz nie potrzeba żadnego programu, aby zrozumieć, o co chodzi. Sprawa staje się trudniejsza, jeżeli w bazie mamy setki czy tysiące osób. Problematyczne staje się również czytanie pliku bez znajomości podstaw angielskiego. Znaczniki formatu GEDCOM (podobnie jak wielu innych) są zredagowane w tym języku. Masz jednak do dyspozycji cały zestaw narzędzi, które pomogą przeczytać tak przesłane dane.

Podstawową zasadą zapisu jest grupowanie informacji, wyznaczane przez pierwszą cyfrę w każdym wierszu. I tak nagłówek pliku zaczyna się od 0 HEAD (header - nagłówek) i kończy się na kolejnym wierszu zaczynającym się od 0, czyli 0 @SUB1@ SUBM. Analogicznie informacje dotyczące narodzin zaczynają się od 1 BIRT i wszystkie wiersze aż do następnego rozpoczynającego się od 1 (w naszym przypadku 1 CHR) dotyczą narodzin - 2 DATE 3 Feb 1862 to data narodzin, a 2 PLAC Zabrzeg 74 to ich miejsce.

Najważniejsze sekcje poziomu 0 pliku GEDCOM to:

HEAD - informacje ważne dla technologów, a więc nazwa i wersja oprogramowania, które posłużyło do utworzenia pliku, kilka informacji technicznych oraz - co szczególnie ważne - data wygenerowania pliku;

SUBM - informacje kontaktowe osoby, która wygenerowała plik - w domyśle osoby, która zebrała informacje;

INDI - każda sekcja stanowi opis pojedynczej osoby;

FAM - każda sekcja stanowi opis jednej rodziny;

TRLR - zakończenie pliku.

Oprócz wymienionych informacji pliki GEDCOM mogą zawierać mnóstwo innych szczegółów, takich jak źródła danych, informacje multimedialne (zdjęcia, wideo) itd.

Jak już wspomniałem, czasami zdarzają się znaczniki niezgodne z formatem. Jeżeli oprogramowanie nie rozpozna znacznika, to albo ignoruje taki wiersz, albo umieszcza dane w nim zawarte w specyficznym polu, aby można je było następnie przenieść ręcznie w inne, odpowiednie pola.

Paweł Wimmer
"stankiewicz.e.pl/forum/viewtopic.php?t=451"