archivo .pdf
|
| #1 (permalink) |
| Nuevo miembro Registrado: mayo 2005 Mensajes: 8 | hola a todos. Tengo un texto en un archivo .pdf que esta en ingles y necesito "extraerlo" de ese formato para que mi programa traductor lo pueda procesar...la cuestión es que el .pdf va con contraseña y no me deja hacer nada. ¿se os ocurre la manera de poder traducir el texto?....habí apensado en imprimirlo, scanearlo y luego traducir lo resultante, pero es que son mas de cien folios..y el palizón puede ser mediano. Se me ocurre que me propongais algun programa para recuperar la clave del .pdf o algun traductor que trabaje con este tipo de archivos o lo que mejor veais...gracias a todos. |
| | |
|
| #2 (permalink) |
| Miembro Deluxe Registrado: mayo 2005 Ubicación: no sabo Mensajes: 7.615 | Hola Para recuperar contraseñas en .PDF hay bastantes aplicaciones como estas: http://advanced-pdf-password-recover...c.com/ie/18474 http://www.lostpassword.com/acrobat.htm Sin embargo, si la contraseña está "bien puesta" (más de 6 caracteres, combina letras y números, mayúsculas y minúsculas, símbolos especiales, etc.) despídete porque será muy difícil a no ser que pongas el ordenador a trabajar semanas (o meses e incluso años)... De todos modos, ¿dices que lo puedes imprimir? ¿No tiene protección contra impresión? Entonces, si tienes Office XP/2003 instalado, la cosa puede ser sencilla... Y es que Office te mete en el sistema -a no ser que durante la instalación especifiques lo contrario- una impresora virtual denominada Microsoft Office Document Image Writer. Si al imprimir desde alguna aplicación -como por ejemplo el Acrobat- escoges esta impresora virtual como salida del documento, el archivo lo podrás convertir a formato .TIFF multipágina, que es el tipo de archivo que usan casi todos los programas de reconocimiento de caracteres (OCR)para reconocer texto. De este modo, con alguna aplicación OCR como FineReader, Readiris, Cuniform o Textbridge, ya lo tendrás listo para meterlo en tu "traductor". Como además los .TIFF resultantes serán claritos, no tendrás problemas con el OCR si es una versión actual Saludos y suerte |
| Cita:
| |
| | |
|
| #3 (permalink) |
| Miembro activo Registrado: diciembre 2004 Ubicación: Pentium 4 3.6GHz, 1GB RAM, 120GB HD Mensajes: 243 | Hay otra opción y es instalarte el GSView http://gsview.softonic.com/ie/34404 En la misma página verás que te pone que requiere el GhostScript, por lo que deberás descargar los dos, e instalar GhostScript primero. Gracias a él he podido extraer el texto de PDF protegidos |
| | |
| Herramientas | |
| Estilo | |
| Tema | Iniciado por | Foro | Respuestas | Último mensaje |
| Discu duro, AYUDA | Psyker | Hardware | 9 | 22 oct 2005 00:06 |
| Ya he puesto el linux | mjmx | Configuración | 10 | 02 oct 2005 18:08 |
| Archivo Torrent Desaparecido | Manuel III | P2P | 4 | 23 sep 2005 20:35 |
| apertura archivo adjunto Outlook Express | tinajo | Hardware | 3 | 15 jul 2005 23:51 |
| manual de emule | miguelws | Internet | 3 | 05 jul 2005 10:45 |

Modo lineal