Sto lavorando su un progetto con file enormi che contengono solo il set {[0-9] ,.}. La codifica in UTF-8 o ASCII crea file enormi.
Mi chiedo se potrei trovare un modo per codificare in soli 4 bit (rendi questi file 16 volte più piccoli). Avrei abbastanza di 16 caratteri!
Come posso procedere? Sto lavorando su Python e ho provato il seguente codice. Sembra che il computer non lo voglia, perché cancella solo ciò che era nel file di testo ...
def encodeData(self, filePath):
print("File size before 4bits Encoding = {} Bits" .format(os.path.getsize(filePath)))
print("Proceed with '{}' 4 bit Encoding... ".format(filePath))
with open(filePath, "w+") as file2encode:
for line in file2encode.readlines():
for i in len(line):
line[i] = 0x4
print("File size After 4bits Encoding = {} Bits".format(os.path.getsize(filePath)))
C'è un modo per giocare con la codifica a 4 bit?