Parsery bibliograficzne

Wydobywanie danych z bibliografii

Niekiedy zmuszeni jesteśmy do "wyciągnięcia" danych bibliograficznych z tekstów. W przypadku pojedynczych pozycji najłatwiej przepisać dane ręcznie.
W przypadku dużych bibliografii (np. z naszej dawnej pracy dyplomowej) ręczne przepisywanie jest nieefektywne. Wówczas warto zastosować narzędzia automatyczne zwane parserami bibliografii.

Techniki informatyczne, wykorzystujące niekiedy narzędzia sztucznej inteligencji, pozwalają na zaawansowaną analizę składni (parsing). Wyspecjalizowany program - (z ang.) parser - potrafi przeanalizować składnię wpisów bibiograficznych. Dzięki temu możliwe jest wydobycie metadanych z klasycznych bibliografii załącznikowych.

Anytstyle — bardzo dobre darmowe narzędzie

Polecany parser bibliograficzny: https://anystyle.io/

Powyższa aplikacja potrafi sprawnie odtworzyć metadane z bibliografii z wykorzystaniem technik uczenia maszynowego. Daje też możliwość przejrzenia wyników i poprawy ich. Po zakończeniu weryfikacji metadane można zapisać w jednym z popularnych formatów (np. BIB). Następnie plik taki można zaimportować do menadżera bibliografii (Zotero, Mendeley, itp.).

Uwaga: wyniki procesu analizy należy zawsze zweryfikować!

Parser używa typowych nazw pól metadanych, poniżej lista najczęściej używanych:

author nazwiska i imiona/inicjały autora lub autorów
booktitle tytuł książki, której rozdział jest cytowany
chapter tytuł rozdziału
edition numer wydania książki (np, "Second")
editor nazwiska i imiona/inicjały redaktora lub redaktorów
journal Tytuł czasopisma (z reguły wszystkie człony oprócz spójników piszemy z wielkiej litery, niekiedy używa się typowych skrótów)
volume/issue tom lub numer czasopisma, z którego pochodzi cytowany artykuł
pages strona/zakres stron (np. 7, 49-52, 57nn)
publisher nazwa wydawcy
series nazwa serii, w której wydawana jest książka (opcjonalnie)
title tytuł cytowanej pracy
year rok publikacji

Więcej o metadanych i nazwach pól w stylu BiBTeX w języku angielskim.