読み込み中...

HTMLと自動化翻訳を使った7つの実用テクニック

HTML翻訳自動化方法、初心者向け解説、サンプルコードの画像 HTML
この記事は約18分で読めます。

【サイト内のコードはご自由に個人利用・商用利用いただけます】

この記事では、プログラムの基礎知識を前提に話を進めています。

説明のためのコードや、サンプルコードもありますので、もちろん初心者でも理解できるように表現してあります。

本記事のサンプルコードを活用して機能追加、目的を達成できるように作ってありますので、是非ご活用ください。

※この記事は、一般的にプロフェッショナルの指標とされる『実務経験10,000時間以上』を満たす現役のプログラマチームによって監修されています。

※Japanシーモアは、常に解説内容のわかりやすさや記事の品質に注力しております。不具合、分かりにくい説明や不適切な表現、動かないコードなど気になることがございましたら、記事の品質向上の為にお問い合わせフォームにてご共有いただけますと幸いです。
(送信された情報は、プライバシーポリシーのもと、厳正に取扱い、処分させていただきます。)

はじめに

HTML文書に翻訳と自動化の処理を組み込むと、静的なページ更新だけでは追いつきにくい多言語対応を整理しやすくなります。特に、原文の管理、表示先の切り替え、更新漏れの防止を分けて考えると、作業の見通しが立ちます。

その一方で、翻訳結果をそのまま画面へ流し込むだけでは、意味の崩れ、属性値の欠落、アクセシビリティ情報の不足が起こりやすくなるのが基本です。自動化は作業量を減らす手段ですが、構造化された原文と確認しやすい出力先があって初めて安定します。

このため、テンプレート、辞書データ、API連携、ビルド処理、表示確認の役割を分けて設計するのが実用的です。HTMLの多言語化に必要な考え方を、実装時の判断に使える形で整理します。

動作確認環境
  • HTML Living Standard
  • JavaScript ECMAScript 2024
  • Google Chrome 126 / Mozilla Firefox 127 / Safari 17.5 相当のモダンブラウザ
  • Node.js 20 LTS を利用するビルド自動化を想定
📖 この記事で学べること
  • 翻訳対象の文字列を構造化して管理する考え方
  • 自動化しやすいHTMLテンプレートの作り方
  • API翻訳と人による確認を組み合わせる設計
  • 属性、フォーム、リンク、画像代替テキストの注意点
  • 公開前に確認したい品質チェックの観点

結論: 翻訳対象を分離して自動化する

HTMLの翻訳と自動化で特に押さえたいのは、画面構造と文言データを混ぜすぎないことです。<main><nav><article><section>などの構造はテンプレートに残し、見出しや説明文はJSONYAMLへ切り出すと扱いやすくなります。

その形にしておくと、翻訳API、静的サイト生成、CMS更新、差分確認をつなげやすくなります。一方、すべてを機械翻訳に任せると、専門用語やUI文言のニュアンスが崩れる場合があるため、最終的な確認は人が読める単位で残す必要があるのが目安です。

公式仕様を確認する場面では、HTMLの構文や要素の意味はWHATWG HTML Living Standard、ブラウザAPIの使い方はMDN Web Docs の Fetch APIが一次情報として参照できます。翻訳処理をfetch()で呼び出す場合も、まず仕様に沿った入出力を決めると保守しやすくなります。

💡 Tips: 翻訳を自動化する前に、原文、訳文、画面表示、レビュー状態を分けて管理すると、後から言語を増やすときの修正範囲を狭められますし、ここがポイントです。

早見表: 多言語化で確認する項目

これらの項目を最初にそろえると、翻訳対象の抜け漏れを発見しやすくなります。自動化の対象を広げるほど確認点も増えるため、テキストだけでなく属性やメタ情報まで一覧化しておくと判断が安定します。

対象 関連する要素や属性 自動化の扱い 確認する観点 補足
ページ見出し<h1>辞書データで管理検索意図と一致しているか長すぎる訳文は調整
章見出し<h2> <h3>キー名で紐付け目次で意味が通るか機械的な直訳を避ける
本文<p>段落単位で管理文脈が途切れないか長文は分割する
リンク文字<a>URLと文言を分離遷移先の内容と合うか内部リンクは固定IDで扱う
画像代替alt画像IDに紐付け画像内容を説明できるか装飾画像は空値も検討
フォームラベル<label>入力項目ごとに管理入力目的が伝わるかforとの対応を確認
入力補助placeholder補助文として分離ラベル代わりにしていないか翻訳後の長さに注意
ボタン<button>短いUI文言として管理操作内容が明確か動詞の粒度をそろえる
エラー文aria-describedby状態別に管理原因と対処が読めるか専門語を減らす
通知文role="status"イベント単位で管理画面読み上げに合うか短文に寄せる
タイトル<title>ページ単位で生成検索結果で自然かブランド名の位置を決める
説明文meta name="description"言語別に生成要約として成立するか文字数を調整
言語指定langテンプレートで切替実際の言語と一致するかjaenを使う
方向指定dir言語設定に連動右書き言語に対応するかltrrtlを区別
パンくず<ol> <li>階層データから生成ページ構造と一致するか構造化データも合わせる
表見出し<th>項目名として管理列と行の意味が伝わるかscopeを確認
日付<time>表示形式を変換地域表記に合うかdatetimeはISO形式
数値Intl.NumberFormatロケールで整形桁区切りが自然か通貨記号も確認
日付整形Intl.DateTimeFormatロケールで整形年月日の順序が合うかタイムゾーンを明示
複数形Intl.PluralRules言語規則で分岐単数と複数が自然か日本語との差に注意
読み込みdeferスクリプト読込を調整表示前に文言が必要かちらつきを避ける
非同期処理Promise翻訳APIの応答を待つ失敗時の表示があるかcatch()を用意
データ取得fetch()辞書ファイルを取得キャッシュ設計があるかCache-Controlも確認
DOM反映textContent安全に文字列を入れるHTML断片を混ぜないかinnerHTML乱用を避ける
テンプレート<template>繰り返しUIに使う文言キーが重複しないか部品単位で管理
データ属性data-i18n翻訳キーを埋め込む命名規則があるか画面から追跡しやすい
アクセシビリティaria-label表示文言とは別管理読み上げで意味が通るかアイコンボタンで使う
SEO代替hreflang言語別URLを対応相互参照しているか正規URLと合わせる
構造化データJSON-LD言語別に生成ページ内容と一致するか不要なQ&A化を避ける
公開前確認npm run build生成処理に含める差分が確認できるか人のレビューも残す

原文管理を分ける設計

翻訳を安定させる出発点は、原文を画面から探し回らなくても済む状態にすることです。data-i18nのようなキーを要素へ置き、実際の文言を外部ファイルに持たせると、デザイン修正と文言修正を分離できます。

そのキーは、home.hero.titleform.contact.submitのように画面名、部品名、役割を含めると追跡しやすくなります。一方、text1button2のような連番だけでは、翻訳担当者が文脈を読み取れず、訳語の揺れが起こりやすいでしょう。

具体的には、見出し、本文、ボタン、エラー、通知を同じ粒度で扱わないことが有効です。ボタンは短い動詞、エラーは原因と対処、本文は文脈を含む段落として管理すると、自動化しても人が確認できる形を保てますが、これは押さえたい点です。

原文の保管形式にはmessages.ja.jsonmessages.en.jsonlocales/ディレクトリなどがよく使われます。これらをGitで管理すれば、翻訳差分、レビュー履歴、差し戻しの理由を追えるようになります。

テンプレートに翻訳キーを埋め込む

これを画面に反映するには、静的な文言の代わりに翻訳キーをテンプレートへ置きますし、これが一つの目安です。たとえば<span><button>data-i18nを付けると、JavaScriptやビルド処理が対象要素を見つけやすくなります。

ただし、すべての文言をクライアント側で差し替えると、初期表示が空になったり、検索エンジンが本文を取得しにくくなったりする場合があります。そのため、公開ページではビルド時に各言語のHTMLを生成し、管理画面やプレビューでは動的差し替えを使う設計が現実的です。

このとき、innerHTMLで外部由来の訳文を挿入する方法は慎重に扱いるのがポイントです。通常のテキストならtextContentを使い、リンクや強調を含む文だけを安全なテンプレートとして分けると、意図しないマークアップ混入を抑えられます。

⚠️ 注意: 翻訳APIの応答をそのままinnerHTMLへ入れる設計は避けます。装飾を含む文言が必要な場合も、許可するタグや属性を限定して扱う必要があるのが一般的です。

属性とメタ情報の翻訳漏れを防ぐ

本文だけを翻訳しても、ページ全体の多言語対応としては不足します。画像のalt、フォームのaria-label、入力補助のplaceholder、ページ説明のdescriptionまで確認すると、ユーザー体験と検索表示の両方を整えられます。

その中でも見落とされやすいのが、アイコンボタンの読み上げ名です。画面上に文字がないボタンでは、aria-labelの翻訳が操作理解に直結するため、表示テキストとは別のキーとして管理するのがよいでしょう。

一方、装飾だけの画像に無理な説明を入れると、読み上げが冗長になるのが現実的です。装飾目的ならalt=""を検討し、情報を伝える画像なら訳文でも内容が伝わる代替テキストを用意します。

同様に、<title>meta要素は、本文から自動生成するだけでは不自然になる場合があります。検索結果で読まれる文章として、言語ごとの語順、文字量、ブランド名の扱いを別途調整すると自然です。

API翻訳とレビュー工程を組み合わせる

自動化の中心に翻訳APIを置く場合、APIが担当する範囲と人が確認する範囲を分けますが、覚えておくと役立つでしょう。APIは初稿作成や大量テキストの下訳に向きますが、商品名、法律用語、技術用語、ボタン文言の最終判断まで任せきると誤解を招く可能性があります。

そのため、statusdraftreviewedapprovedのような状態を持たせると、公開可能な訳文だけを抽出できます。こうした状態管理は、CMS、スプレッドシート、リポジトリのどれを使う場合でも応用できると整理できます。

一般に、自動化したい作業ほど失敗時の戻し方が必要になります。翻訳APIの応答が空だった場合、古い訳文を維持するのか、原文へ戻すのか、公開処理を止めるのかを先に決めておくと、障害時の判断がぶれません。

翻訳APIを呼ぶ処理では、timeoutretryrate limitAPI keyenvironment variableの扱いも設計対象になります。秘密情報をクライアントへ埋め込まず、サーバー側やビルド環境で処理する形が一般的です。

ビルド時に言語別ページを生成する

公開サイトで安定しやすいのは、ビルド時に言語別の静的ファイルを生成する方法です。/ja//en//zh/のようにURLを分けると、ユーザーも検索エンジンも言語の違いを理解しやすくなると理解できます。

この方式では、テンプレート、原文データ、訳文データを読み込み、npm run buildやCIで各ページを書き出します。公開前に差分を見られるため、翻訳の更新で意図しないレイアウト崩れが起きていないか確認しやすくなります。

ただし、言語ごとにURLを分ける場合は、canonicalhreflangの関係を明確にすると覚えるとよいでしょう。hreflang="ja"hreflang="en"x-defaultを相互に設定すると、対応する言語ページを検索エンジンへ伝えられます。

多言語サイト全体の内部導線を整えるなら、アンカーリンクの設計ツリー構造の考え方も合わせて確認すると整理しやすくなります。ページ間の関係が明確になると、翻訳ページの追加時にも迷いにくくなると考えられます。

クライアント側で言語を切り替える場面

これに対して、管理画面、デモ、社内ツールでは、クライアント側で言語を切り替える方法も使われます。localStorageに選択言語を保存し、navigator.languageを初期値に使うと、ユーザーごとの表示設定を保てます。

その場合、辞書ファイルをfetch()で読み込み、対象要素のdata-i18nを見てtextContentへ反映すると言えるでしょう。一方、初期表示のちらつきが気になる画面では、最初から選択言語のHTMLを返すほうが自然です。

このとき、言語切り替えボタンは<select><button>aria-currentなどを組み合わせ、現在の言語がわかる状態にします。フォームを含む画面では、入力途中に翻訳で文言を切り替えても入力値が消えないように設計します。

実装パターンとしてよく見るのは、静的ページはビルド生成、動的な管理UIはブラウザ側切り替えという併用です。どちらか片方に寄せるより、公開面と操作面で要件を分けるほうが扱いやすくなるのが基本です。

フォームとバリデーション文言の扱い

フォームでは、翻訳対象が表示テキストだけに収まりません。requiredpatternmaxlengthなどの制約と、ユーザーに見せるエラー文の整合が必要になります。

たとえば、メールアドレス入力のエラーなら、原因、修正方法、対象項目を同じ文で伝えると理解しやすくなります。自動化で文言を生成する場合も、input.email.invalidのように項目と状態を含むキーにすると、翻訳側が状況を判断できるのが目安です。

その設計は問い合わせフォームにも直結します。問い合わせフォーム作成の基本を押さえたうえで、多言語のラベル、確認画面、送信完了文を分けると、ユーザーが迷いにくい流れになります。

一方、ブラウザ標準の検証メッセージは言語やブラウザで表示が変わりますし、ここを基本と考えるとよいでしょう。統一した表現が必要な場合は、setCustomValidity()や独自のエラーメッセージ領域を使い、aria-liveで状態変化を伝える構成を検討します。

日付、数値、単位のローカライズ

翻訳だけでは対応できない情報に、日付、数値、通貨、単位があります。日本語では年月日の順に読む表記が自然でも、英語圏では月日年の順にするなど、ロケールに応じた整形が必要になるのがポイントです。

その処理にはIntl.DateTimeFormatIntl.NumberFormatIntl.RelativeTimeFormatが使えます。これらは文言を翻訳するAPIではなく、表示形式をロケールに合わせるAPIとして整理すると混同しにくいです。

具体的には、データとしては2026-06-14のようなISO形式を保持し、表示時にja-JPen-USへ変換します。元データを文字列の見た目で保存してしまうと、後から言語を増やしたときに再変換しにくくなるのが一般的です。

金額を扱う場合は、currencystyleminimumFractionDigitsなどの設定も確認します。翻訳文の中に数値を埋め込むときは、{count}{price}のようなプレースホルダーを使い、語順の違いに対応できる形にします。

ℹ️ 補足: 数値や日付の表示は翻訳文とは別の処理です。原文の文字列に直接埋め込まず、データと表示形式を分けると変更に強くなるのが現実的です。

レイアウト崩れを前提に確認する

翻訳後の文字量は、言語によって大きく変わります。日本語では短いボタン文言でも、英語やドイツ語では横幅が伸びる場合があるため、固定幅のボタンやカードでは折り返しを想定する必要があります。

このとき、min-widthmax-widthline-heightoverflow-wrapwhite-spaceの扱いが影響すると整理できます。短い原文だけで画面を確認すると、翻訳後に文字がはみ出す問題を見落としやすいでしょう。

実際、スライドやカードUIでは、タイトル、説明、ボタンが同じ領域に入るため、訳文の長さが表示品質に直結します。スライドショーの実装例のような部品では、見た目だけでなく文言差し替え後の余白も確認対象になります。

基本的に、翻訳で長くなる可能性が高い箇所には、固定高さよりも内容に応じて伸びる設計を使いると理解できます。どうしても固定領域が必要な場合は、最大文字数、代替の短い文言、ツールチップの扱いを先に決めます。

差分確認と品質チェックを自動化する

自動化の効果が出やすいのは、翻訳そのものよりも周辺の確認作業です。未翻訳キー、空文字、重複キー、使われていない文言、原文だけ残った箇所を機械的に検出できると、レビューの負担を減らせます。

その検出には、lintschema validationCIpull requestの差分確認を組み合わせますし、ここがポイントです。JSON Schemaで辞書ファイルの形を縛ると、必須キーの欠落や型の不一致を早い段階で見つけられます。

ただし、機械的なチェックだけでは、自然な表現や業界用語の適切さまでは判断できません。自動化は異常の発見と作業の短縮に使い、公開前の確認では画面上の文脈、リンク先、フォームの流れまで読む必要があります。

ページ上で動く日付選択や予約UIを多言語化するなら、カレンダーUIの作成方法も参考になると覚えるとよいでしょう。月名、曜日、エラー文、ボタン文言が関係するため、単純な置換より広い確認が必要になります。

運用で失敗しやすい点

初心者がつまずきやすいのは、最初の翻訳だけを考えて、更新時の流れを決めていないケースです。原文が変わったときに訳文を無効化するのか、差分だけ再翻訳するのか、古い訳文を一時的に残すのかを決めていないと、公開後に内容の不一致が起きやすくなります。

そのため、原文にはsourceHashupdatedAtのような情報を持たせると管理しやすくなると考えられます。原文が変わった場合に翻訳状態をneeds_reviewへ戻せば、古い訳文を誤って承認済みとして扱うリスクを抑えられます。

一方、全ページを一度に多言語化しようとすると、確認対象が広がりすぎます。問い合わせ、購入、登録、ログインなど、ユーザーの行動に直結する画面から優先すると、成果と負荷のバランスを取りやすくなると言えるでしょう。

もっとも、部分的な翻訳だけを公開する場合は、言語が混在する箇所を明示的に把握する必要があります。混在を許容するページ、公開を止めるページ、原文表示へ戻すページを分けると、運用ルールとして説明しやすくなります。

実装方針の選び方

使い分けると、更新頻度が低い公開ページはビルド時生成、ユーザー操作が多い画面はクライアント側切り替え、原文の初稿作成はAPI翻訳が向いているのが基本です。役割を分けるほど、自動化の失敗が全体へ広がりにくくなります。

その判断では、SEO、表示速度、更新頻度、レビュー体制、対応言語数を同時に見ます。検索流入を重視するページなら、言語別URLと静的生成を軸にしたほうが安定しやすいです。

逆に、ログイン後の管理画面やプレビュー画面なら、ブラウザ側で辞書を読み込んで切り替える方法でも問題になりにくいでしょう。画面の目的が検索されることではなく、利用者が作業できることにあるためです。

翻訳と自動化を組み合わせる目的は、すべてを機械任せにすることではありません。人が判断すべき文脈を残しながら、抜け漏れ、差分、生成、整形を機械に任せる構造を作ることが中心になるのが目安です。

公開前に確認したい最終項目

公開前には、言語別ページのURL、langhreflangcanonicalが対応しているか確認します。ページ本体だけでなく、タイトル、説明文、パンくず、構造化データも同じ言語になっているかを見る必要があります。

そのうえで、フォーム送信、カレンダー操作、スライド表示、アンカー移動などのUIを操作し、翻訳後の文字量で画面が崩れないか確認するのがポイントです。内部リンクや送信完了画面まで含めると、ユーザーが最後まで迷わず進めるか判断しやすくなります。

一般に、多言語対応は一度作って終わる作業ではなく、原文更新に合わせて継続的に動く仕組みとして扱います。翻訳、自動化、レビュー、公開判定を分けることで、言語が増えても破綻しにくい運用になるのが一般的です。

これらを踏まえると、HTMLの構造を保ちつつ翻訳データを外へ出し、生成と確認を自動化する構成が扱いやすい選択肢になります。小さなページから始め、辞書管理、属性対応、ビルド生成、差分確認の順に整えると、実務でも継続しやすい形へ近づきます。

関連記事

著者: Japanシーモア編集部

Japanシーモアは、Web/IoT/APP/SYS 分野のプログラミング情報を体系的に提供するメディアです。本記事は編集部による執筆とAI支援を組み合わせて制作し、公開前に編集部が校正しています。誤りや改善案がございましたらお問い合わせよりご連絡ください。

※本記事は実在のエンジニア複数名で構成される Japanシーモア編集部が、AI支援を活用して作成・校正・公開しています。