Descargar libros desde Google Books

Colgadadelperal, una usuaria de Twitter, preguntaba sobre cómo hacer para imprimir libros alojados en Google Books, si bien no todos están completos siempre se puede extraer algo interesante. El problema con este sistema es que por razones obvias (derechos de autos) no permite imprimir o descargar los libros. Pero, siempre se le puede encontrar una vuelta al asunto.
Es así que arme un pequeño script en PHP en el que debemos ingresar la URL del libro que deseamos imprimir o bajar. El único problema requisito es que la dirección a utilizar tiene que ser la de la vista en “Modo HTML básico”, que nos permite ir viendo pagina por pagina, y es esa URL (dirección) la que debemos utilizar para ir extrayendo las imágenes de las paginas. El acceso a este modo de lectura lo pueden encontrar abajo a la derecha en la barra lateral.

Una vez que tenemos la URL de la pagina que deseamos obtener, como por ejemplo:
http://books.google.com/books?ei=WNS1SPfiG6S2yQTz94DeCw&hl=es&output=html
&id=09qTVKsjwSwC&jtp=v
, la misma contiene el comienzo del prefacio del libro “Romeo and Juliet”. Deben ingresar esa dirección en el siguiente formulario:
http://www.martinaberastegue.com/gbooks.php
Y listo, en un par de clics tienen la imagen lista para imprimir o guardar. Espero les sea útil y si se les ocurre alguna forma de optimizar este proceso dejen el comentario!
Actualización 30/09/2008: Joel me menciono por email el caso de algunos libros que no salen completos, solo se muestran algunas páginas. Esto se debe a que Google pone limitaciones a ciertos libros mostrándolos parcialmente; la solución rápida a esto es borrar las cookies de nuestro navegador y volver a acceder al mismo.




23 Comentarios
Miércoles, 27 de Agosto de 2008
ey!! se agradece tanta celeridad en ayudarme!!!
y muy didacticamente explicado que hasta yo lo voy a poder hacer!!!
lo saluda
colgada
Miércoles, 27 de Agosto de 2008
De nada
Domingo, 31 de Agosto de 2008
Hola Martin, muchas gracias por este truquito, excelente para bajar algunos fragmentos de libros.
Domingo, 31 de Agosto de 2008
De nada Willy, esperemos que dure
Miércoles, 3 de Septiembre de 2008
Pero y si quiero bajarme el book entero?, sin tener que pasar todas las url a tu script.
Un saludo
Miércoles, 3 de Septiembre de 2008
Tomás, el problema es que la mayoria de las veces no permite la descarga de los libros, y la unica forma de poder obtenerlo es pagina a pagina.
Miércoles, 3 de Septiembre de 2008
Ola otra vez, pero no se puede emular de alguna forma (y automáticamente) el paso de las “páginas” y así poder tener tantas imagenes como páginas?.
Un saludo y gracias por tu tiempo.
Miércoles, 3 de Septiembre de 2008
Si, en la vista “Modo HTML básico”, arriba tenes dos flechas para ir pasando de una pagina a otra, se podria extraer ese dato tambien e ir generando asi las demas imagenes.
Sábado, 6 de Septiembre de 2008
Que buen post
lo q necesitaba para hacer mi tarea
hay libros muy dificiles d conseguir en google
esto es una gran ayuda
gracias Martín!!
Miércoles, 10 de Septiembre de 2008
Muchisimas gracias necesitaba apenas una paginas de un libro y esta utilidad me fue de gran ayuda, gracias de nuevo y exitos Martín.
Sábado, 13 de Septiembre de 2008
Muchas gracias Martín, necesitaba saber el dato que propones. Mi único problema es que quiero descargar un libro que tiene 292 páginas!!! pero si no hay otra manera… desarrollaré mi paciencia….
Saludos y gracias de nuevo
Martes, 30 de Septiembre de 2008
Hola Martin,
Al parecer la gente de google, ya noto tu script.
Ya que desde ayer no funciona.
Bueno, gracias igual por que me fue de gran ayuda mientras se pudo.
Saludos,
Yoel
Martes, 30 de Septiembre de 2008
Google habia “arreglado” la web para evitar el funcionamiento del script pero ya lo modifique asi que sigue andando. Gracias Yoel por el aviso.
Jueves, 2 de Octubre de 2008
Martin, queria seguir accediendo a otras paginas de un libro, pero llegue al limite, Borre los cookies con ccleaner, y accedi nuevamente pero igual seguian bloqueados, me podrias ayudar a borrar lo cookies de alguna otra manera
Miércoles, 8 de Octubre de 2008
Hola Martín, estoy probando el script pero no me funciona, introduzco esta dirección: “http://books.google.es/books?id=TQT6DF3_YgkC&pg=PA161&lpg=PP1&dq=tratamiento+digital+de+im%C3%A1genes&output=html&sig=ACfU3U0M4DeDMyLo4VoOJPyGoe8_12CzHQ”, que es la primera página del capítulo que quiero conseguir, pero no me muestra ninguna imagen.
Podrías comprobar si el script sigue funcionando?
Gracias y un saludo.
Miércoles, 8 de Octubre de 2008
va_lentin: el script sigue funcionando pero parece ser que han puesto alguna limitacion para los libros de acceso limitado (los que solo podemos ver algunas paginas).
Encontre dos webs que permiten hacer lo mismo que mi script, y son mas faciles de utilizar tambien:
http://book.huhiho.com/
http://book.leechvideo.com/
, no funcionan con el caso que plantea va_lentin, pero es bueno tener otras opciones por si Google bloquea el acceso desde mi servidor.
Viernes, 10 de Octubre de 2008
Hola, genial este espacio cultural, te felicito,quiero descargar este libro:
http://books.google.cl/books?id=jFpy2N_KcUEC&pg=PP1&lpg=PP1&output=html&sig=ACfU3U0bZygMA_PyCnWyZ1zm6P389WQs-w
Pero no puedo sabes alguna manera para hacerlo?, seguí todos los pasos que indicaste pero = no puedo, lo genial es que a este libro se le permite mostrar todas las páginas pero solo he descargado 15 de 166
y luego se queda ahi, es normal que se demore?
Viernes, 10 de Octubre de 2008
Hola Pablo, probaste con alguno de los enlaces que publique en el comentario anterior al tuyo?, recien hice la prueba y me devolvio 82 paginas, anda probando y bajando las que te faltan.
Saludos
Jueves, 23 de Octubre de 2008
Hola Valentin…
Tu pagina es:
http://books.google.es/books?id=TQT6DF3_YgkC&pg=PA161&img=1&zoom=3&hl=es&q=&sig=ACfU3U3w8bY6oyB3RqwD0heli2eoCSURaQ
Y en el caso de Pablo…
Tu pagina es:
http://books.google.cl/books?id=jFpy2N_KcUEC&pg=PP1&img=1&zoom=3&hl=es&q=&sig=ACfU3U3LkcrTETyUc1LgjoRYZ0jGoqR5ng
Sábado, 25 de Octubre de 2008
Para automatizar el procedimiento:
La dirección entre una página y otra (de un libro) cambia únicamente por el parámetro pg, por ejemplo la página 9 es:
http://books.google.com.gt/books?id=j37MnHK2xQkC&pg=PA9&lpg=PP1&output=html
y la 10 es:
http://books.google.com.gt/books?id=j37MnHK2xQkC&pg=PA10&lpg=PP1&output=html
Una pequeña variación al script nos permitiría obtener todas las páginas disponibles y solamente necesitaríamos conocer el número total de páginas del libro.
Sábado, 25 de Octubre de 2008
Cristian: probe con un par de links a libros y no me funciono con todos :S
Miércoles, 12 de Noviembre de 2008
Martín pasate el script para analizarlo y crear un programa en visual basic.
Para automatizar el proceso de descarga!
Miércoles, 12 de Noviembre de 2008
Con la informacion que tenes en el post te alcanza :), el resto es procesar el codigo fuente de la pagina y buscar la imagen entre “X” y “Z” etiqueta.
Comente, su opinión me interesa :)