ok pour les *.doc mais PAS pour les *.RTF; pour word une autre solution: utiliser antiword
pour RTF: catdoc (mais problème d'accents doublés, je cherche encore sinon faudra faire du sed), ou sdf ou unrtf ou unoconv
#! /usr/bin/bash # [[word2txt]] Script to automatically convert word doc files to plain txt files # Usage: # Required: http://wvware.sourceforge.net/ + elinks # apt-get install wv elinks # # Authors: # FR, radeff@akademia.ch # History # 2005.11.18: FR, created # To do: ######### echo "Script to automatically convert word doc files to plain txt files" echo "************" WD=`pwd` echo "Now converting all files under" .$WD echo "************" j=0 find . -name "*.doc" -o -name "*.DOC" | while read i do j=$j+1 echo "$j Converting wvText $i TO $i.txt" wvText "$i" "$i.txt" done echo "************" #echo "Finished, $k files converted" echo "Finished, all files converted"