コトバンクはYahoo!辞書と技術提携しています。

文字コード モジコード

ASCII.jpデジタル用語辞典の解説

文字コード

コンピューター上で文字を表示するために、ひとつひとつの文字に固有に割り当てた番号のこと。「キャラクターコード」とも呼ばれる。ASCIIコードシフトJISコードUnicodeなどの体系がある。

出典 ASCII.jpデジタル用語辞典ASCII.jpデジタル用語辞典について 情報

知恵蔵の解説

文字コード

文字コードとは、コンピューターで文字を扱うために、それぞれの文字に対して識別番号を割り当てるルールを定めたもののこと。同じ日本語でも規格によってJISコードシフトJISコード、EUCUNICODEなどの文字コードがあり、利用シーンによって使い分けられている。初期のパソコンでは、日本語の表示に英数字2文字分を使っていたため、日本語側を基準に「全角文字」と呼び、半分の幅の英数字を「半角文字」と呼んだ(全角幅の英数字も別途存在する)。現在はフォントや個々の文字によって文字幅が異なるが、全角/半角の呼称はそのまま利用されている。

(斎藤幾郎 ライター / 2007年)

出典 (株)朝日新聞出版発行「知恵蔵」知恵蔵について 情報

パソコンで困ったときに開く本の解説

文字コード

パソコンなどのデジタル機器で、文字を扱うためのルールを定めた規格のことです。パソコンで扱えるのは基本的には数字だけですが、文字を一覧表にして、文字ごとに決まった番号を割り当てることで、文字を表現できるようになりました。この、文字の一覧表と数字の割り当ての規格が文字コードです。パソコンで日本語を表記するための文字コードには、「JIS」「シフトJIS」「日本語EUC」「ユニコード」などがあります。
⇨EUC、JISコード、
シフトJISコード、ユニコード

出典 (株)朝日新聞出版発行「パソコンで困ったときに開く本パソコンで困ったときに開く本について 情報

デジタル大辞泉の解説

もじ‐コード【文字コード】

コンピューターで文字や記号を扱うために、それぞれの文字や記号に割り振られた固有の符号。日本語の文字コードは、JIS(ジス)コード・シフトJIS・EUC(イーユーシー)・ユニコードが主に使用されている。→JISコードシフトJISEUCユニコード

出典 小学館デジタル大辞泉について 情報 | 凡例

ホームページ制作用語集の解説

文字コード

文字を利用するために個々の文字や記号に割り振った記号、バイト表現。欧米などで使われる英数字の文字コードは1バイトで表現されるが、これでは日本語の漢字などは収録できないため、日本や中国、韓国などではそれぞれ独自に2バイト(最大65536文字)のコード体系を定め、自国内で使用している。

出典 (株)ネットプロホームページ制作用語集について 情報

IT用語がわかる辞典の解説

もじコード【文字コード】

文字や記号をコンピューターで扱えるよう、個々に割り当てられた固有の符号。欧米の英数字は1バイトの情報量(最大256文字)で表現され、ASCII(アスキー)という文字コード体系が広く用いられる。漢字などの字種が多い言語においては独自の文字コード体系が存在し、日本には2バイトの情報量(最大65536文字)を持つJISコードシフトJISコードEUCの3種類がある。◇「キャラクターコード」ともいう。

出典 講談社IT用語がわかる辞典について 情報

世界大百科事典 第2版の解説

もじコード【文字コード character code】

文字集合を伝送,蓄積,処理するため,符号と1対1に対応させる規則を文字コードまたは符号化文字集合という。文字は離散的かつ冗長な情報なので,符号に対応させると誤りには弱くなるが,伝送,処理などの能率は改善される。古くは電信に使ったモールス符号が有名である。欧文モールス符号の場合,文字集合はアルファベットや数字やいくつかの特殊文字で,そのおのおのに短点と長点組合せを対応させ,その組合せを送信して文字情報を伝えた。

出典 株式会社日立ソリューションズ・クリエイト世界大百科事典 第2版について 情報

ブリタニカ国際大百科事典 小項目事典の解説

文字コード
もじコード

コンピュータで文字を伝送したり蓄積したり処理するために決められた符号化の体系。アメリカ規格協会 ANSIが 1963年に 7ビット(パリティビットを含めると 8ビット=1バイトとなる)でアルファベットや図形文字,制御文字など 128文字を定めたアスキー符号(アスキーコード)を提唱し,全世界で使われるようになった。日本や中国などの漢字使用国では,文字の種類が多いためコード化は遅れたが,1978年に日本工業規格 JISが,国際規格で制定された 7ビット情報交換用符号をもとに 1文字を 2バイトで表す JIS漢字コードを制定した。1983年に改定され,字体の簡略化,異体字の入れ替え,記号の追加が行なわれ,1990年には補助漢字が追加された。そのほかに,パーソナル・コンピュータで多く使われているシフトJISコード,日本語対応ユニックスで使われる EUC; Extended UNIX Codeなどいくつもの文字コードがある。このため,使用するコードの設定が異なると,文書が読めないなどの問題が生じる場合がある。世界中で使われている文字をコード化しようというユニコードプロジェクトがアメリカ合衆国の企業などを中心に進められたが,当初設定した単位である 2バイトコードでは文字が収まりきらず,追加的に一部を 4バイトコードにするなどしたため,複雑なものとなっている。パーソナル・コンピュータのオペレーティングシステム OSレベルではすでにユニコードに対応している。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

日本大百科全書(ニッポニカ)の解説

文字コード
もじこーど
character cord

コンピュータ上では、文字はデジタル符号で表される。この符号を文字コードという。キャラクターコードともいう。アルファベットのように字種の数が少ない場合は符号として必要なビット数が少なくてすみ、1バイト(8ビット)が1文字に割り当てられているが、字種の多い漢字を使う日本語などでは1文字に数バイト必要である。アメリカでは早くからASCII(アスキー、アメリカ規格協会が1962年に制定した文字コード)が標準として用いられ、普及したが、日本語の場合、JIS(ジス)で定められてはいたものの不十分であったことからさまざまな変形が現れ、標準に乱れが生じた。その結果、電子メールやホームページの表示に、入力した文字と出力した文字が違う、いわゆる文字化け現象を引き起こすこととなった。現在使用されている日本語コードには、JIS7、Shift-JIS、EUC、UNICODEなどがある。しかし数万の漢字やアラビア語など多くの言語の文字コード化が進み、世界標準も整備されつつある。この整備が行き渡れば、文字化けから解放され、いずれの言語のホームページも正しい表示を見ることができるようになる。
 漢字は字種が多いことが、これまではコンピュータ化されにくい大きな理由になっていた。しかし、日本で現在流通している漢字では、使用頻度の高い2000字種くらいまでで90%、さらに5000字種まで広げるとあらゆる文章の99%まで表記可能であるといわれている。過去に使用された漢字すべてを入れても、たかだか10万字であろう。この程度の数ならば、もはや現在のコンピュータ技術では処理の面でも記憶量の面でも問題とならない。漢字の文字コード化問題を複雑にしているのは、字種と書体(フォント)の違い、また、誤字か異体字かなどの問題が錯綜(さくそう)していることである。文字コードは字種との一対一の関係をもつことに意味がある。ところが同一の意味をもつ漢字でも日本、中国、台湾、韓国で微妙に字形が異なる字がある。これを異なる字種として扱うべきかどうか。また人名などでは画数の縁起を担いで標準字形に点を増やすなどした、つくられた字(異体字)も多く、これらも異なる字種として区別するべきかどうか。過去の人名には戸籍の届け出に際しての誤字さえある。文字コードは情報の分類や検索、照合の基礎データとなるものであり、コンピュータの幾何級数的性能向上を考慮するならば、単純に字種を一つのデジタル符号として表す文字コード化の方法には限界がきているのかもしれない。[田村浩一郎]

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

文字コードの関連キーワードテキストエンコーディングフォルダーcharacter codeテキストエディターマルチバイト文字テキストファイルJIS 2004プレーンテキストトランスレータCJK統合漢字機種依存文字EBCDIC2バイト文字EUC二バイト文字一バイト文字1バイト文字JIS90改行コードコンバートコード変換

今日のキーワード

天網恢恢疎にして漏らさず

《「老子」73章から》天の張る網は、広くて一見目が粗いようであるが、悪人を網の目から漏らすことはない。悪事を行えば必ず捕らえられ、天罰をこうむるということ。...

続きを読む

コトバンク for iPhone

コトバンク for Android

文字コードの関連情報