Prova a utilizzare prima pdftotext
o ebook-convert
per convertire il PDF in testo:
brew install poppler;pdftotext file.pdf
/Applications/calibre.app/Contents/MacOS/ebook-convert file.pdf file.txt
Quindi se per esempio il file di testo ha un formato come questo:
2012-12-31
paragraph 1
paragraph 2
2013-01-01
paragraph 1
paragraph 2
Prova a eseguire un comando come questo:
awk -v RS= -F'\n' '{print $0>($1".txt")}' file.txt
O se il file di testo ha un formato come questo:
2012-12-31
paragraph 1
paragraph 2
2013-01-01
paragraph 1
paragraph 2
Prova a eseguire un comando come questo:
ruby -e '$<.read.split("\n\n\n").each{|s|title,content=s.split("\n\n",2)
File.open(title+".txt","w"){|f|f.puts content}}' input.txt