====== Úprava UTF-8 používajícího spřežky ====== * použít program ''norm-utf8'': #!/usr/bin/env python import sys, unicodedata if __name__ == '__main__': if len(sys.argv) != 2: sys.exit(1) filename = sys.argv[1] f = open(filename, 'r') ori = unicode(f.read(), 'utf-8') res = unicodedata.normalize('NFC', ori).encode('utf-8') f.close print res, * anebo utilitu ''uconv'' pro převod do NFC z NFDuconv -f utf8 -t utf8 -x nfc ====== Odstranění BOM ====== sed 's/^\xEF\xBB\xBF//'nebotail –bytes=+4 text.txt(pokud je BOM hned na začátku souboru)