For Emacs: -*- coding: utf-8 -*- IN1020 L?sningsforslag for ?velsesoppgaver 1.-6.9.2017 Oppgave 1 sjekkes i oppgave 2. Oppgave 3 Kommandoen ?file tekst-*? gir f?lgende svar: tekst-1.txt: UTF-8 Unicode text tekst-2.txt: ISO-8859 text tekst-3.txt: ASCII text Oppgave 4 Dette er forskjellene: tekst-1.txt: ... c2 ab ... c3 a6 ... c2 bb ... tekst-2.txt: ... ab ...... e6 ...... bb ...... tekst-3.txt: ... 22 ...... 61 ...... 22 ...... Her ser vi de tre tegnene ? ? ? kodes som to byte i tekst-1.txt (som er i UTF-8) men som ¨Śn byte i tekst-2.txt (som er i ISO-8859). I tekst-3.txt (som er i ASCII) er de erstattet med " a " fordi de tre tegnene ??? ikke finnes i ASCII. Oppgave 5 Kommandoene iconv -f ISO8859-1 -t UTF-8 tekst-2.txt >tekst-2-utf8.txt iconv -f ASCII -t UTF-8 tekst-3.txt >tekst-3-utf8.txt vil konvertere som ?nsket. Da vil kommandoen file tekst-*-utf8.txt fortelle oss at filene vi laget er tekst-2-utf8.txt: UTF-8 Unicode text tekst-3-utf8.txt: ASCII text S? er neste sp?rsm?l: Hvorfor er tekst-3-utf8.txt stadig ASCII? Det er, som nevnt i forelesningen, en egenskap ved UTF-8 at ASCII er ?innebygget? i UTF-8 og forblir uendret.