[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Bibtex
- To: mindfood@xxxxxxxxxxxxxxx
- Subject: Bibtex
- From: Jose San Leandro <jose.sanleandro@xxxxxxxxxxxx>
- Date: Mon, 4 Jun 2007 12:22:32 +0200
- Delivered-to: mailing list mindfood@orange-soft.com
- Delivered-to: moderator for mindfood@orange-soft.com
- Mailing-list: contact mindfood-help@orange-soft.com; run by ezmlm
- Organization: Ventura24
- User-agent: KMail/1.9.7
Hola,
¿Cómo organizáis todos vuestros libros/articulos/documentos en
pdf/html/chm/...?
Yo dediqué tiempo a seguir una nomenclatura en el nombre de los ficheros, para
indicar, además del título (y en el caso de conocerlo), la editorial, el
autor, el año o la edición. Dado el número de ficheros, me llevó tiempo ir
renombrando sus nombres más o menos manualmente.
El caso es que estoy intentando catalogar esa información (inicialmente no el
contenido), para poder realizar búsquedas o al menos como inventario (ya que
parece que da igual el tamaño de los discos duros, siempre te falta espacio y
siempre estás tratando de liberarlo).
Hice un script [1] en bash muy rudimentario, abusando de awk, que genera
entradas bibtex [2] con el título y la editorial. Un find, un pipe al script,
una redirección de la salida y unas cuantas macros de emacs (bueno, un par de
horas definiendo y ejecutando macros, mejor dicho), y como resultado tengo
una colección en formato bibtex. Me quedarían otras cinco :).
Por el momento estoy usando Tellico [3], que permite importar datos en ese
formato, y con él puedo visualizar la colección y generar informes en html
con un motor de búsquedas implementado en Javascript.
Lamentablemente, hay muchos metadatos soportados por bibtex que no puedo
obtener sin analizar el contenido del documento. He visto que para algunos
pdfs una aplicación Gnome, llamada Referencer [4], permitiría obtener
automáticamente sus metadatos. Aún no lo he probado, pero soy escéptico no
tanto respecto a la aplicación, sino a la 'pulcritud' de los documentos.
La aplicación debería admitir un conjunto de entradas bibtex, resolver la ruta
al fichero (lo he anotado en el tag "note") de cada una, leer el fichero
referenciado, y obtener los metadatos. En todo caso, si permite pasarle los
datos desde linea de comando podría ser automatizada, con Expect[5] si es
necesario.
¿Este tipo de problema lo tenéis solucionado? ¿Cómo?
Lo que persigo en última instancia es similar a lo que ofrece Safari [6]:
poder buscar por el contenido o por keywords o metadatos. Pero el fin está
muy lejos y cada paso me consume una cantidad exagerada de tiempo en tareas
manuales.
Un saludo,
Jose.
[1] http://www.acm-sl.org/browser/misc/trunk/bin/importbookcd.sh
[2] http://en.wikipedia.org/wiki/BibTeX
[3] http://periapsis.org/tellico/
[4] http://icculus.org/referencer/
[5] http://expect.nist.gov/
[6] http://safari.oreilly.com/