Maskinöversättning av text

Alla känner till översättningsprogrammet Google translate. Tekniken med maskinöversättningar har förbättrats avsevärt under senare år. Till en börja använde sig översättningsprogrammen av ren lexikon-översättningar, vilket medförde att översättningarna blev mycket dåliga. Man kunde i stort sett bara se vad texten ungefärligen handlade om. Därefter har översättningsprogrammen utvecklats mycket.

När det gäller översättningar brukar man tala om källspråk och målspråk. Amerikanska försvaret (underrättelsetjänsten) började tidigt att översätta ryska texter (även tidningstext) för att kunna ”fånga upp” vad som kunde vara av intresse. När man väl hittat vad som var intressant på källspråket gjorde man en manuell översättning till målspråket. Senare kom maskinöversättningar som byggde på statistiska jämförelser. Man tog helt enkelt reda på vad som var den vanligaste översättningen av ett ord på källspråket. Inte heller den tekniken gav särskilt bra översättning, men de var bättre än de som endast byggde på lexikonöversättning. Numera bygger många översättningsprogram på en neural teknik som är en form av artificiell intelligens (AI). När programmet byggts upp har man använt sig av stora volymer manuella översättningar (copula). Ett exempel är användningen av kanadensiska parlamentets stora databas med översättningar mellan engelska och franska språken. Allt textmaterial i parlamentet tillgängliggörs på både engelska och franska. En annan sådan copula som använts är FN-organisationens enorma databas av översättning mellan de stora FN-språken. Neurala program lär sig helt enkelt hur manuella översättningar brukar bli. Bara de två – tre senaste åren översättningskvaliteten ökat markant.

Kvaliteten hos neurala maskinöversättningar (MT) beror på hur nära språken står varandra och hur stora textvolymer som har använts för att ”lära upp” programmet. Exempelvis är MT-översättningar mellan engelska och franska i allmänhet betydligt bättre än mellan andra ”mindre” språk. Det tycks vara så att MT-översättningar mellan svenska och finska är sämre än översättningar mellan engelska och franska.

Översättningarnas kvalitet är i hög grad beroende på vad texterna innehåller. Översättning av standardiserad facktext kan bli mycket bra, medan översättning av skönlitterär text kan bli riktigt dålig. Att låta MT-översätta poesi är nog inte ens möjligt. Man har nått goda resultat av att maskinöversätta väderrapporter mellan ett antal språk. Det beror förmodligen på att ord som ”regn”, ”nederbörd”, ”lätt bris” och andra sådana uttryck avser naturvetenskapliga fenomen som är kända inom alla språkområden och redan har fasta begrepp (men kan afrikaner tala om ”nysnö” och ”halkvarning”?).

De för allmänheten tillgängliga stora översättningsprogrammen är Google translate och Bing translate. Det senare är Microsofts MT-program. I varje fall när det gäller Google translate görs alla översättningar via engelska språket. Det ställer till en del problem. Om jag exempelvis ska översätta en svensk text till finska så översätter Google först den svenska texten till engelska och sedan den engelska texten till finska. Det går visserligen vidunderligt fort, men resultatet kan på vissa punkter blir helt fel. Det är förmodligen bättre att skriva en text på engelska och sedan översätta den med Google till finska.

Det som vill använda sig av MT bör nog ha tämligen goda kunskaper i både källspråket och målspråket för att kunna undvika de värsta språkliga grodorna.

Nu kan man på olika sätt förbättra användningen av MT. Språkens närhet gör att MT-översättningar blir bättre om språken ligger nära varandra. Min uppfattning är att en översättning från svenska till tyska blir bättre än en översättning till engelska, trots att översättningen till tyska går via engelskan. Kanske beror det på att svenskan och tyskan i sin språkliga konstruktion ligger varandra närmare än svenskan och engelskan. Om man exempelvis vill översätta ett språk som man inte alls kan, så kan förståelsen öka om man översätter till flera språk som man behärskar. Då jag översätter en text från franska (som jag inte kan) till svenska så ökar min förståelse om jag samtidigt översätter texten engelska och till tyska. Då får jag tre översättningar av samma text och kan jämföra. Många gånger framträder då de språkliga grodorna tydligare på det sätt. MT-översättningar måste nästan alltid korrigeras. I varje fall måste de kontrolleras.

Låt mig ta några exempel med ett kort textstycke om Uppsala domkyrka ( från Wikipedia).

Källtexten lyder:

Bygget började 1272 eller 1273 under ledning av en anonym fransk arkitekt. Det avbröts tillfälligt omkring 1280, troligen på grund av pengabrist, och den franska byggnadshyttan reste hem. De hann bygga nedre delarna av kapitelsalen (nuvarande Jagellonska gravkoret) och de två kapellen på nordsidan av koret (se planritning). Materialet var främst tegel, men kalksten från Gotland och från ett mindre stenbrott i Lena socken användes för pelare, fönster och andra detaljer.

I översättning av Google till engelska:

The building began in 1272 or 1273 under the direction of an anonymous French architect. It was suspended temporarily around 1280, probably due to money shortage, and the French building hut traveled home. They built the lower parts of the chapel (the current Jagellon burial ground) and the two chapels on the north side of the chorus (see floor plan). The material was mainly brick, but limestone from Gotland and from a small quarry in Lena parish was used for pillars, windows and other details.

I översättning av Bring till engelska:

The construction began 1272 or 1273 under the direction of an anonymous French architect. It was temporarily interrupted around 1280, probably due to a lack of money, and the French building’s cabin went home. They managed to build the lower parts of the chapter Hall (current Jagiellonian chapel) and the two chapels on the north side of the choir (see Floor plan). The material was mainly brick, but limestone from Gotland and from a small quarry in Lena parish was used for columns, windows and other details.

I översättning av Google till tyska:

Der Bau begann 1272 oder 1273 unter der Leitung eines anonymen französischen Architekten. Es wurde um 1280 vorübergehend ausgesetzt, wahrscheinlich wegen Geldmangel, und die französische Bauhütte fuhr nach Hause. Sie bauten die unteren Teile des Kapellensaals (die jetzige Jagellon-Grabstätte) und die beiden Kapellen an der Nordseite des Chores (siehe Grundriss). Das Material bestand hauptsächlich aus Ziegeln, aber Kalkstein aus Gotland und aus einem kleinen Steinbruch in der Pfarrei Lena wurde für Säulen, Fenster und andere Details verwendet.

I översättning av Bring till tyska:

Der Bau begann 1272 oder 1273 unter der Leitung eines anonymen französischen Architekten. Sie wurde um 1280 vorübergehend unterbrochen, vermutlich wegen Geldmangels, und die Kabine des französischen Gebäudes ging nach Hause. Sie schafften es, die unteren Teile des Kapitels Hall (aktuelle Jagiellonische Kapelle) und die beiden Kapellen auf der Nordseite des Chores zu bauen (siehe Bodenplan). Das Material war hauptsächlich Ziegel, aber Kalkstein aus Gotland und aus einem kleinen Steinbruch in der Pfarrei Lena wurde für Säulen, Fenster und andere Details verwendet.

Om Arwidson

Jurist bosatt och verksam i Stockholm
Detta inlägg publicerades i Okategoriserade. Bokmärk permalänken.