[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Bibtex



Hola,

¿Cómo organizáis todos vuestros libros/articulos/documentos en 
pdf/html/chm/...?
Yo dediqué tiempo a seguir una nomenclatura en el nombre de los ficheros, para 
indicar, además del título (y en el caso de conocerlo), la editorial, el 
autor, el año o la edición. Dado el número de ficheros, me llevó tiempo ir 
renombrando sus nombres más o menos manualmente.
El caso es que estoy intentando catalogar esa información (inicialmente no el 
contenido), para poder realizar búsquedas o al menos como inventario (ya que 
parece que da igual el tamaño de los discos duros, siempre te falta espacio y 
siempre estás tratando de liberarlo).
Hice un script [1] en bash muy rudimentario, abusando de awk, que genera 
entradas bibtex [2] con el título y la editorial. Un find, un pipe al script, 
una redirección de la salida y unas cuantas macros de emacs (bueno, un par de 
horas definiendo y ejecutando macros, mejor dicho), y como resultado tengo 
una colección en formato bibtex. Me quedarían otras cinco :).
Por el momento estoy usando Tellico [3], que permite importar datos en ese 
formato, y con él puedo visualizar la colección y generar informes en html 
con un motor de búsquedas implementado en Javascript.
Lamentablemente, hay muchos metadatos soportados por bibtex que no puedo 
obtener sin analizar el contenido del documento. He visto que para algunos 
pdfs una aplicación Gnome, llamada Referencer [4], permitiría obtener 
automáticamente sus metadatos. Aún no lo he probado, pero soy escéptico no 
tanto respecto a la aplicación, sino a la 'pulcritud' de los documentos.
La aplicación debería admitir un conjunto de entradas bibtex, resolver la ruta 
al fichero (lo he anotado en el tag "note") de cada una, leer el fichero 
referenciado, y obtener los metadatos. En todo caso, si permite pasarle los 
datos desde linea de comando podría ser automatizada, con Expect[5] si es 
necesario.

¿Este tipo de problema lo tenéis solucionado? ¿Cómo?

Lo que persigo en última instancia es similar a lo que ofrece Safari [6]: 
poder buscar por el contenido o por keywords o metadatos. Pero el fin está 
muy lejos y cada paso me consume una cantidad exagerada de tiempo en tareas 
manuales.

Un saludo,
Jose.

[1] http://www.acm-sl.org/browser/misc/trunk/bin/importbookcd.sh
[2] http://en.wikipedia.org/wiki/BibTeX
[3] http://periapsis.org/tellico/
[4] http://icculus.org/referencer/
[5] http://expect.nist.gov/
[6] http://safari.oreilly.com/