1 :名無しさん@涙目です。:NG NG PLT(13121).net

コンピューターで全漢字使用可に 6万字コード化 

日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか 
扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、 
コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。 

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、 
日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、 
戸籍で使われているものをはじめおよそ5万字に上っています。 

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、 
データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を 
充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったり 
するなどの問題が起きていました。 

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、 
コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。 

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを 
正確に分析できたりするなどの効果が期待されています。 

IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが 
追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。 

■漢字とコンピューターのこれまで 

戸籍で使われている文字のうち例えば「渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は 
「斉」「斎」「齊」「齋」などおよそ60種類ありますが、このうちコンピューターが扱えるのは「べ」は3文字、「サイ」は 
15文字ほどです。 

また「吉田」の「ヨシ」のつくりが「土」になっている漢字も外字です。日本で初めて漢字のコードが作られたのは 
昭和53年のことで、当時はコンピューターの能力が低く大量のデータを扱えないことなどから登録された漢字は、 
およそ6000字でした。 

その後、昭和54年に世界初の日本語ワープロが発売されるなど家庭や企業でパソコンが普及して、さまざまな 
漢字を扱う必要が出てきましたが、コードの整備は進まず、コードのない漢字は、それぞれのメーカーがばらばらに 
作っていました。 

現在は、およそ1万字の漢字にコードが付いていますが、いまだに特定のソフトでなければ表示できない漢字もあり、 
対応が急がれていました。 

■企業や自治体も一苦労 

(略) 

■IT企業でも… 

(略) 

https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html 
2 :名無しさん@涙目です。:2017/12/24(日) 19:33:10.63 ID:1B4bynNX0.net
さすがアップルやな、これからも一生アップル使うわ 

3 :名無しさん@涙目です。:2017/12/24(日) 19:33:16.98 ID:+0iqOz260.net
吉野家はちゃんと書けるの? 

4 :名無しさん@涙目です。:2017/12/24(日) 19:34:06.87 ID:ADdgEuTl0.net
その前にsjisとeucとutfを何とかして 

5 :名無しさん@涙目です。:2017/12/24(日) 19:34:34.39 ID:dDxGM9hKO.net
さいとうさんとわたなべさんだけに朗報 

6 :名無しさん@涙目です。:2017/12/24(日) 19:34:40.93 ID:zI17Wdf70.net
( `ハ´)<丶`∀´> 搭載もインストールもさせないアルニダw 

7 :名無しさん@涙目です。:2017/12/24(日) 19:35:11.20 ID:eG4oDqE90.net
フォントは誰が用意するんだ? 

8 :名無しさん@涙目です。:2017/12/24(日) 19:35:17.23 ID:FMfFaCUQ0.net
もうUTF8だけで良くね? 

9 :名無しさん@涙目です。:2017/12/24(日) 19:35:26.21 ID:a7y1PqvO0.net
UTF-8じゃなくて独自キャラクタセット? 

10 :名無しさん@涙目です。:2017/12/24(日) 19:35:33.26 ID:PKItkQ0h0.net
中国の漢字は何文字あるの? 

11 :名無しさん@涙目です。:2017/12/24(日) 19:35:46.70 ID:iPWlb7CZ0.net
苗字旧字体だから助かるわ 

12 :名無しさん@涙目です。:2017/12/24(日) 19:35:48.31 ID:M5EhgwlT0.net
それ以前に常用漢字とかいう糞制度を根本的に考えなおせ 

13 :名無しさん@涙目です。:2017/12/24(日) 19:35:49.56 ID:Q+VTLOBt0.net
なべの辺じゃなかったんか 

15 :名無しさん@涙目です。:2017/12/24(日) 19:36:39.73 ID:wemqGe0N0.net
Unicode埋め終わったんだ 

16 :名無しさん@涙目です。:2017/12/24(日) 19:37:09.59 ID:AFeSba2S0.net
>渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は 
「斉」「斎」「齊」「齋」などおよそ60種類 

これ漢字を簡単なやつに統一したらいいじゃん 
無駄なことを 
漢字も時代とともに変遷してきて多様性ができてしまったのに 
そのうちの一つにこだわるようなクソみたいなアイデンティティなんかステさせろ 

18 :名無しさん@涙目です。:2017/12/24(日) 19:37:24.37 ID:w2368IcE0.net
Unicodeのユの字も出てないけどバカが書いた記事かな? 

21 :名無しさん@涙目です。:2017/12/24(日) 19:37:53.04 ID:Au1+Vg0i0.net
漢検一級に出てくるような漢字は廃止しろよ 
変換したくても読めねーから面倒くせーよ 

23 :名無しさん@涙目です。:2017/12/24(日) 19:38:29.39 ID:LfXOtTaM0.net
どうせデータ連携で化けるんだから余計な事しなくても 
なきゃないで終わりなのに 

26 :名無しさん@涙目です。:2017/12/24(日) 19:39:59.94 ID:RrvIlUnz0.net
しょうもない事に予算使うな 

27 :名無しさん@涙目です。:2017/12/24(日) 19:40:02.47 ID:QUrXN0bm0.net
あれ、、1日15文字くらいのお仕事? 

28 :名無しさん@涙目です。:2017/12/24(日) 19:40:21.49 ID:Jp6EfYB50.net
こんなバカげた文字に付き合わされる欧米人も大変だな 

31 :名無しさん@涙目です。:2017/12/24(日) 19:41:35.96 ID:7yqUuuIy0.net
草なぎも変換できるな 

32 :名無しさん@涙目です。:2017/12/24(日) 19:41:59.10 ID:0A0zdG1s0.net
こんなもんに15年もかかる未開の土人国 

33 :名無しさん@涙目です。:2017/12/24(日) 19:42:04.85 ID:dJATDXTe0.net
コンピュータおばあちゃん~ 

34 :名無しさん@涙目です。:2017/12/24(日) 19:43:13.95 ID:BvKtoIHE0.net
最近認印で正しい苗字のものが見当たらなくなってきた 

35 :名無しさん@涙目です。:2017/12/24(日) 19:44:05.42 ID:ezxnPrY90.net
フォントデザイナーの災厄 

36 :名無しさん@涙目です。:2017/12/24(日) 19:44:17.80 ID:luU06Ppq0.net
山のくねくね道って意味で峠があるので、山へんの代わりに金にして、金上下の漢字を作って欲しい。 
当然読みはギャンブル。って意味で 

38 :名無しさん@涙目です。:2017/12/24(日) 19:44:45.24 ID:d8yYWPJq0.net
2バイトに収まって良かったね 

39 :名無しさん@涙目です。:2017/12/24(日) 19:45:08.03 ID:AAVKFMki0.net
よし、次はプログラムが認識してくれる1バイトの半角漢字を搭載してくれ 
なおかつ見た目は細長くなくて、全角と同じように表示される奴な! 

40 :名無しさん@涙目です。:2017/12/24(日) 19:45:09.32 ID:GAJRAkF30.net
山形にいたころ、「玉」の上の棒を取って「つち」と読む 
苗字があったんだが、そんなのにも対応してんのかね。 

41 :名無しさん@涙目です。:2017/12/24(日) 19:45:48.77 ID:WlhUghpj0.net
え? 
これ既存データどうすんの? 
やるの? 
ヤダよヤダヤダヤダ 

42 :名無しさん@涙目です。:2017/12/24(日) 19:46:51.44 ID:KGHpsw+70.net
これは良くやった!と褒めてあげたい 

43 :名無しさん@涙目です。:2017/12/24(日) 19:46:59.66 ID:jIHWZ1sQO.net
無駄な事に幾らかけたんだろうか 

45 :名無しさん@涙目です。:2017/12/24(日) 19:48:56.15 ID:oeIk+ncu0.net
それでいつから使えるようになるんだ? 

47 :名無しさん@涙目です。:2017/12/24(日) 19:49:56.51 ID:j0feavu10.net
昔TRONというのがあってだな… 

48 :名無しさん@涙目です。:2017/12/24(日) 19:50:02.29 ID:GEDJ9G/x0.net
それより半角カナとかいう人類悪を早く根絶して欲しい。 
あんなものは人道に反する罪で裁かれるレベルだ 

50 :名無しさん@涙目です。:2017/12/24(日) 19:51:19.20 ID:kKWrYEwV0.net
馬鹿じゃねえの 

52 :名無しさん@涙目です。:2017/12/24(日) 19:51:53.60 ID:CD7VVLqt0.net
Windowsではいつから使えるの? 

55 :名無しさん@涙目です。:2017/12/24(日) 19:53:00.66 ID:4KD4IWXw0.net
超漢字がないとは 

56 :名無しさん@涙目です。:2017/12/24(日) 19:54:12.36 ID:gP6gnIa10.net
ソノマエニハンカクカナヲハイシシロ 

57 :名無しさん@涙目です。:2017/12/24(日) 19:55:22.90 ID:53TLoaEA0.net
やったぜ!名前も常用漢字以外も付けられるようにして 

58 :名無しさん@涙目です。:2017/12/24(日) 19:56:21.42 ID:awSHZnB80.net
4万文字格納している第4水準に+2万字? 
第5水準になるの? 

60 :名無しさん@涙目です。:2017/12/24(日) 19:56:53.20 ID:5gE6HO8y0.net
その点26文字で済むアルファベットは優秀だな 

61 :名無しさん@涙目です。:2017/12/24(日) 19:57:01.51 ID:5YvbZiqz0.net
中国は漢字を簡略化する方向に進んでいるのに日本は逆行するのか? 
姓は全部旧字で書く動きになって余計ややこしくなりそう。 
元号と一緒、害悪でしかない。 

63 :名無しさん@涙目です。:2017/12/24(日) 19:58:54.63 ID:7Nrprazz0.net
はしご高登録されるのか 

64 :名無しさん@涙目です。:2017/12/24(日) 19:59:29.85 ID:HZCapToz0.net
常用漢字とか人名漢字とかの制限の方をきつくしてくれればそんな大事業は要らなかったんじゃないのか 

65 :名無しさん@涙目です。:2017/12/24(日) 19:59:51.23 ID:SaxS7Jg00.net
ついに三国志ヲタの苦労が報われる日が来たか 

66 :名無しさん@涙目です。:2017/12/24(日) 20:01:09.85 ID:Nfv5rN2i0.net
草なぎは? 

67 :名無しさん@涙目です。:2017/12/24(日) 20:01:18.58 ID:ypgukzXC0.net
そもそもIMEが対応していないと変換できないに一票 
コードの中にあっても候補として呼び出されないよね 

70 :名無しさん@涙目です。:2017/12/24(日) 20:02:25.40 ID:9n3iNsiR0.net
外字登録いらないの? 
ぃまさらかよ 

71 :名無しさん@涙目です。:2017/12/24(日) 20:03:23.93 ID:YZWDIxfn0.net
結局JIS第一、第二以外を使うと読めないので迷惑でしかない 

72 :名無しさん@涙目です。:2017/12/24(日) 20:03:30.78 ID:wc81z2Ql0.net
普通の人が使えるようになるのは何時だろう? 

76 :名無しさん@涙目です。:2017/12/24(日) 20:06:02.99 ID:xCfLLm8X0.net
努力だけ評価する 

79 :名無しさん@涙目です。:2017/12/24(日) 20:08:25.10 ID:g5M9KQDZ0.net
ついに大漢和辞典オンライン版が発行可能になるのか 

80 :名無しさん@涙目です。:2017/12/24(日) 20:09:33.99 ID:PTc95fiA0.net
これは簡単な方に統一すべきでは? 
高と梯子高、浜と濱と賓と眉浜とか斉藤とか種類がありすぎて困るから簡単なのにしろよ 
でなきゃ手間が掛かりすぎて困る 

81 :名無しさん@涙目です。:2017/12/24(日) 20:10:12.28 ID:hZTBNa4k0.net
サイトウとワタナベいい加減にせえよ 

82 :名無しさん@涙目です。:2017/12/24(日) 20:11:27.15 ID:UGdYqCKX0.net
クソIMEに入ってないと使えないけどな 

83 :名無しさん@涙目です。:2017/12/24(日) 20:11:38.86 ID:uUlXb0qA0.net
そういや漢字って新しい奴増えないの? 
略字とかじゃなくて 

84 :名無しさん@涙目です。:2017/12/24(日) 20:12:15.64 ID:8UNaW86M0.net
やったやん 

85 :名無しさん@涙目です。:2017/12/24(日) 20:12:32.58 ID:fhcZniOO0.net
さすが岡ちゃんや 

86 :名無しさん@涙目です。:2017/12/24(日) 20:12:35.56 ID:21sZGhhe0.net
マイナンバーとか推進する前にこれ終わらせとけよ無能 

89 :名無しさん@涙目です。:2017/12/24(日) 20:15:06.57 ID:d8yYWPJq0.net
超漢字OSとは何だったのか 

90 :名無しさん@涙目です。:2017/12/24(日) 20:16:13.39 ID:G2OT0vrN0.net
一方ユニコードコンソーシアムはどうでもいい絵文字を増やしていた 

92 :名無しさん@涙目です。:2017/12/24(日) 20:16:45.48 ID:EJ8OsgJT0.net
役員仕事しろ 

93 :名無しさん@涙目です。:2017/12/24(日) 20:16:56.97 ID:L/bdTRyD0.net
トロンコード? 

96 :名無しさん@涙目です。:2017/12/24(日) 20:22:11.25 ID:z8sryiQB0.net
漢字は94x94=8836文字で全てと思って生活すれば問題なし 

97 :名無しさん@涙目です。:2017/12/24(日) 20:23:06.56 ID:z8sryiQB0.net
役場の役人の手癖のせいで新しい文字が増えたりした 

101 :名無しさん@涙目です。:2017/12/24(日) 20:27:03.83 ID:XTBhpnum0.net
Googleに頼めば半月でできたのに 





転載元
http://hayabusa3.2ch.sc/test/read.cgi/news/1514111550/