Sto lavorando su un carattere tipografico e sto cercando di generare casi di test su come vengono renderizzate stringhe specifiche. Qual è il modo più semplice per rasterizzare automaticamente molti file di testo diversi in una bitmap?
Sto lavorando su un carattere tipografico e sto cercando di generare casi di test su come vengono renderizzate stringhe specifiche. Qual è il modo più semplice per rasterizzare automaticamente molti file di testo diversi in una bitmap?
Aggiungi un'intestazione html con la selezione dei font (per mezzo di cp e > >) e poi usewkhtmltoimage ( link ) per generare immagini da quello. In alternativa, guarda il codice sorgente e scrivi circa 20 righe di codice Qt usando lo stesso approccio.
Prova del concetto in PyQt5:
from PyQt5 import QtCore, QtGui, QtWidgets
app = QtWidgets.QApplication([])
w = QtWidgets.QWidget()
w.setWindowTitle('Textbox to image')
font = QtGui.QFont()
font.setFamily("Herculanum")
font.setBold(True)
textbox = QtWidgets.QTextEdit(w)
textbox.setFont(font)
textbox.resize(280, 40)
textbox.setText("Lorem ipsum dolor sit amet, consetetur sadipscing elitr")
textbox.grab().save("image.png")
Risultato (png):
Questo, con distorsione personalizzata è come ho effettivamente creato un set di dati ML di grandi dimensioni per OCR da caratteri personalizzati.