アメリカの非営利団体であるアパッチソフトウェア財団Apache Software Foundation(ASF)が公開しているビッグデータ(大規模データ)を効率的に分散処理、管理するためのオープンソースのソフトウェア。通常はハドゥープ(Hadoop、ハデュープとも読む)と略して使われる。グーグルGoogle社の自社システム基盤に関する論文に触発された技術者たちの活動をきっかけにして、グーグル社と異なるプログラム言語のJava(ジャバ)を使って開発された。
ハドゥープはコンピュータで取り扱うデータの規模が急激に大きくなっている状況にあわせ、大規模なデータ管理が可能な分散データベース(HBase)を備えることにより、コンピュータの台数を段階的に数千台規模まで増やしても管理ができる。このような並列的な規模の拡大はハードウェアの障害が起きやすくなる弊害を生むが、ハドゥープ分散ファイルシステム(Hadoop Distributed File System=HDFS)は、一部のコンピュータが故障してもデータは維持される仕組みをもつ。また、MapReduce(マップレデュース)という分散処理システムによって、データのバッチ(一括)処理実行中に一部のコンピュータが故障しても、処理自体は継続して行われるようになっている。こうした耐障害性や拡張性、維持コストに優れる点を評価され、ヤフーYahoo!やフェイスブックFacebookなどの世界規模の情報サービスを提供する企業に採用され、以降、金融機関や大手オンラインショップなどでも採用する動きが広がっている。
[編集部]
年齢を問わず、多様なキャリア形成で活躍する働き方。企業には専門人材の育成支援やリスキリング(学び直し)の機会提供、女性活躍推進や従業員と役員の接点拡大などが求められる。人材の確保につながり、従業員を...
10/29 小学館の図鑑NEO[新版]動物を追加
10/22 デジタル大辞泉を更新
10/22 デジタル大辞泉プラスを更新
10/1 共同通信ニュース用語解説を追加
9/20 日本大百科全書(ニッポニカ)を更新