J・K・ローリングの書いたハリー・ポッターの物語には、魔法の写真が登場する。魔法の写真は、普通の写真と似ているが、写真の中の人物が動くという点で異なっている。写真の中の人物は手を振ったり笑ったりし、ときには別の用事でいなくなってしまうこともある。
魔法の写真はローリングの並外れた創造力から生まれた。しかし、シアトルにあるワシントン大学の大学院生であるチュン・イー・ウェンらのおかげで、もうすぐ「マグル(物語の中で、魔法を使えない普通の人間を指す言葉)」でも、魔法の写真に似たものを手に入れられようになるかもしれない。ウェンたちが開発した「フォト・ウェイクアップ(Photo Wake-Up)」というソフトウェアを使えば、他のものは動かさず、写真に写る中央の人物だけをアニメーションで動かすことができるのだ。
このタスクは「言うは易く行うは難し」である。コンピューター科学には未解決の重要な問題があるからだ。それは姿勢認識の問題だ。2次元の人の画像を与えられると、マシン・ビジョンは判断に困ってしまう。その人物がどのような3次元のポーズを取っているかが分からないのだ。
姿勢認識が難しいのは、体が部分的に隠れてしまうことがあるからだ。腕を組んで立っているときのように、他の体の部位によってある部位が覆われることがある。機械が2次元画像から3次元構造を把握することが難しいのはこのせいだ。
これまでコンピューター科学を研究するさまざまなチームがこの問題に挑んできた。ウェンたちが使ったのは、マイクロソフトとドイツのマックス・プランク知能システム研究所のチームが開発した「SMPL」というプログラムである。
姿勢認識の最初の作業は、人の体を2次元で切り抜き、その上に3次元の骨格を重ねることだ。そうすれば骨格を動かし、動作を作ること …