学籍番号 | 氏名 | 研究テーマ |
s97010ah | 安西 弘憲 | 写真から3D画像を作成するプログラムの作成 |
s97013is | 井口 晋太郎 | Visual Basicによる医用画像処理 |
s97037ot | 大越 隆弘 | 不可視物体の3次元化 |
s97105ty | 高橋 友一 | 仮想世界における現実的な立体認識のためのステレオ画像の生成 |
s97114tt | 田邉 司 | Visual Basicによる楽譜入力システムの作成 |
s97135nm | 丹羽 真英 | Visual Basicを利用した医療用画像処理 |
s97158hh | 堀 博英 | 3次元コンピュータグラフィックスの原理と制作 |
s97171mh | 水野 栄登 | VRMLによる立体大学案内図の作成 |
s97184yt | 山田 尚 | Visual C++ によるペイント系ソフトウェアの作成 |
s97185yt | 山田 俊之 | ファジィを使った競馬予想 |
s94043ot | 小山 岳仁 | Visual Basic による自動楽譜認識・演奏ソフト |
本研究のテーマは、「写真から3D画像を作成するプログラムの作成」である。物体の三次元モデルを作成するには、三次元ディジタイザやレンジファインダなどの入力装置によって三次元データを入力する方法があるが、これは建造物のような大きなものや、何らかの理由によって移動が不可能な物体には使用することができない。また、三次元CG作成ソフトを使って三次元モデルを作成する場合、どんな物体でも再現できるが、そのためには非常に多くの時間と手間がかかる。
このようなときに有効なのが、「イメージ・ベースドソフト」という、写真などの二次元画像から三次元モデルを作成できるソフトである。その特徴は、読み込んだ画像に対して作業を行うため、短時間で簡単に三次元モデルを作成できることである。用途としては、実寸にもとづいた測量が可能なソフトが多いことなどから、建築の分野において最も利用されている。また、その使いやすさから工業製品のデザインなどにも多く利用されている。
本研究では、これらのソフトがどのような方法で三次元モデルを作成しているのかを調査し、説明する。その後で、それを参考にして自分で作成したプログラムの処理方法と、三次元モデルの作成手順について説明する。
私がこの医用画像の処理というテーマで研究した動機は、放射線技師である父親の影響が大きい。小さいときからレントゲンについての話を聞かされていたので、関心をかなり持っていた。また、最近では医療の現場もレントゲン写真だけでなく、CT(computed
tomography)、CR(computed radiography)、MRI(magnetic resonance imaging)などデジタル化が進みコンピュータを利用してその画像の処理を行い、より見やすく、より病気の発見がしやすくなるように発展している。そのような医療用画像の処理について、学び、そして研究したいと思ったからである。
さまざまな画像の処理の方法とその原理、Visual Basicの基礎や利用法などを学び、プログラムを作った。その結果、平滑化、1階微分、2階微分の処理をつけることができた。また、マウスで画像をクリックするとその部分が出力され、その部分に対しても同じ処理が加えられる様にした。
これからの課題として、病気だと思われる部分の抽出などその他の処理を付け加えることが必要である。また、プログラムをもっと扱いやすいように工夫することが必要だと思う。
近年ではテレビや各書籍などを通して様様な映像や、コンピュータグラフィックスなどが目にされており、ゲームはもちろん、映画などでも使用されるようになっている。なかでも目をひかれるものは3次元で構成されるコンピュータグラフィックスであり、そのリアルさは実際に存在しているように感じるものも少なくはないと思う。それでは3DCGとはどのようにしてその質感を表現しているのでしょうか。3次元の概念で構成された物体に実写の写真を貼り付けたり、着色すればそれだけでその物体が存在しているようにみえるのだろうか。このことから私の興味は始まり、では透明なものなどはどのようにして表現されているのか。実際の透明な物体をテクスチャとして貼り付けることによって表現できないデジタルの透明な物体とはどのようにして表現されているのだろうか、このような思いからこの研究を始めてみました。内容としては透明な物体を表現するものですから、その色のほとんどが光の反射によって表現しています。物体のそれぞれに、光を当てた際に反射させる色を設定していき、実際の着色は黒(無色)としています。しかし、実際にこの処理を行ってみると、その処理にかかる時間は多大なものであり、一つ一つを試すというレベルではありませんでした。研究の途中からはこの処理にかかる時間を短縮させることに重点を置くこととなってしまった。
ここ数年のコンピュータグラフィックスの進化はハード的にもソフト的にも目覚しいものがある。されど、出力されたピクセルデータの価値はコンピュータ自身にとって何か価値のあるものだろうか。コンピュータにとっての画像に対する意味付けを行うためには、どのような画像を用意すればいいのかということが重要なテーマのひとつとなってくる。そこで今回は人間の主たる認識機構である視覚を簡単なモデルであらわした“ステレオ画像”に着目してみることにし、3D世界からのステレオ画像を生成に挑戦してみた。 具体的にはOpenGLとLinuxの組合せを用いて、「ある注視点を基準として
描画された(すなわち3次元情報を失っている)視点の異なる画像2枚分」の画像を生成・取得・保存するプログラムの製作をおこなった。OpenGLのユーティリティに添付されている、ティーポットの回転の模様をキーボードからの入力で制御しているときの一場面の画像情報を読みだし、画像を保存する専用の関数を作成しておき、生成された段階でよびだして保存するようにして、プログラムが完成した。
しかし、実際にプログラムを走らせたところ、保存の形式の問題から上下さかさまになったり、描画のコマ落ちが発生したりなどの問題が発生した。
今後今回作った画像や実際にデジタルカメラで撮影した静止画を用いて認識を行いたい。幾つかのデータを捨ててしまっているので、画像データだけから復元作業を行わなくてはならない。ゆえに、まず認識のためには画像を高速に解析する必要がある。さらにそのための高速な解析アルゴリズムを考案しなければならない。またCCDカメラなどで取得した実際の写真の解析も検討している。
私はVisual Basic(VB)を使用して、楽譜の入力システムを作成する、というテーマで研究をした。市販されているシーケンスソフトよりも、もっと使いやすいソフトを作ることを目的としている。
この研究では、現在、コンピュータミュージックで最も多く使われているMIDIという規格のデータを使用する。このMIDIは、世界共通の統一規格で、今やコンピュータミュージックに限らず、通信カラオケやインターネット上でも使われているものである。
MIDIのデータは「音の高さ、大きさ、長さ」と音色や効果を、数値化した演奏情報である。このデータをVBで操作し、音を出力させ、さらに楽譜として画面上に表示させる。
まず、音の出力と音階の設定、そして、演奏タイミングの設定を重点に研究していくために、チェックボックスを使用したオルゴールを作成した。音の出力と音階の設定には、midiOutShortMsgを使用し、演奏タイミングの設定には、タイマー関数を使用した。さらに作ったデータを記録しておくために、データのセーブと、ロードの機能も作成した。
次に、五線譜による入力システムを作成した。フォーム上に五線譜を表示させて、その上に音符を置いていく。音符を置くだけでなく、消去も出来るようにした。音符の種類も4分音符と8分音符を置けるようにし
て、その音符の種類によって、音の長さも決めるようにした。音符の旗も、音符のある位置によって向きを決定した。さらにタイマーコントロールを使用することで、演奏のテンポの変更も可能になった。
今回の研究ではMIDIデータの解析と、VBの熟知に時間がかかったうえに、シーケンスソフトに必要な機能が多かったことで、ここまでのシステムしか作成できなかった。しかし、今回得られた知識や技術は、とても内容の濃いものとなった。今後、この研究を続けていくかどうかに関わらず、この知識や技術は、私にとってとても役に立つものになるのではないかと思う。
近年、パーソナルコンピュータは低価格化、高性能化が進み様々な分野で活用されている。その中で私が興味を持ったのは、CTスキャンなどの医療用画像であり、その種類や系統、処理方法などの研究を始めた。医療用画像処理は、一般的な現場で使われる工業用画像処理と違い、目的の画像を取得することが困難である。その理由として、対象が生体であるので形状が複雑で、個人差があり、画像取得の条件を変化させることが困難であることが挙げられる。
目的の画像を取り出すために、有効な手段となるのが画像認識処理である。これは、対象とする画像が何を意味しているか、また、何を含んでいるかを把握する作業をコンピュータに代行させることである。この手順は、まず、対象とする画像内に存在するパターンを基準となる参照パターンと比較し、識別、分類し、それに対する特徴抽出の処理を行う。さらに、抽出した画像に認識アルゴリズムを用いることにより、目的の画像を認識出力する。特徴を抽出するための処理として、平滑化、微分処理、階調処理、画像の鮮鋭化などがある。画像データは生成する過程で、ノイズや歪みが含まれる場合が多いので、処理を行う前にこういった処理を施すことで画像の補正や復元を簡単にすることができる。
この研究では肺のレントゲン画像を使用し、肺の部分だけを取り出すことを目的とした。画像処理を実行するためにVisual
Basicを利用し、画像の表示と平滑化、線の抽出などの処理を行うことができた。しかし、ここで行った処理は処理後の画像に新たな処理を行うことができず、時間的制約により目的の画像を取り出すまでは至らなかった。今後研究を続ければ、さらに特徴を抽出する処理を増やし、必要のない部分の画像を削除して目的の画像のみを取り出すことができただろう。現段階ではまだ医師がレントゲン写真を見てすべてを判断するという状況が続いており、患部の見落としが30%あるといわれている。しかし、この技術の確立が進むことにより、医師の大きな手助けとなり、より安心できる診断が可能になるはずである。今後も医療用画像処理がどのような発展をするか注目したい。
現在、コンピュータグラフィックス(以下CG)は、映像表現になくてはならないほどのポピュラーな道具へと普及してきた。CGを大々的に使用した映画、テレビ、より作りこまれ大規模CGを駆使したゲームの世界等がある。近年身近に使われはじめてきたCG、それはハードウェアの性能の飛躍的な向上により実現できたものである。また、数千万、数百万、のコンピュータから10万円以下のコンピュータまで広くCGが描ける様になったそんな中で3次元コンピュータグラフィックス(以下3DCG)のアニメーションについて、どの様に使われ、何できるのか研究してみたいと思った。3Dの基本概念、3DCGの特徴、アニメーション、代表的なソフトウェアについてしらべ3DCGをShadeとLightWave3Dを使用して実際に作り、アニメーションを作成してみる。実際に3DCGを作り、3DCGアニメーションの原理を理解し、また3DCGのハードウェア、ソフトウェアともにまだまだ発展途上であると感じた。
コンピューターグラフィック(以下CG)が30数年前に誕生して以来、驚異的な速度で進歩し、今日に
至った。CGは、人間の肉眼では捉えられないミクロの世界や、人間の神秘的な構造を空間を超えて明らか
に示し、美術の領域にも大きな影響を与えている。また、グラフィックソフトウェアを用いた画像処理技術は、
多くの広告、ポスター、雑誌、新聞、テレビ、映画、ゲームなどを通じて広く一般に知られるようになってき
た。
私がこのテーマについて研究しようと思ったのも、テレビやゲーム、映画などでCGに興味を持ったからで
ある。
本研究では、新潟国際情報大学での各種催し(学園祭,国家試験,開放講義等)に参加する予定のある
人や、新潟国際情報大学への進学を目指す高校生等、学外の人々を主な対象として、大学に直接足を運
んでもらうことなく、よりリアルな学内情報を多角的に提供するシステムを構築することを目的とした研究開
発に取り組んだ。立体学内案内図を実現するために、3次元表示用言語であるVRML2.0、3次元表示用
BrowserのCosmo Playerを使用する。
立体大学案内図は、実際にその場所に行った感覚を得るという効果が得られ、理解度の高い案内図が
作成できた。しかし、3次元表示はすべての場合に有効ではなく、入り組んだ所では、3次元表示の方が2
次元表示よりわかりにくい。この問題を解決するために、3次元表示のサポートとして2次元表示の案内図を
付け加えた。また、理解度を高める際に解決すべき問題として、多くの情報を付加すると実行速度が下が
る、という問題がある。実行速度は、より少ない容量で表現することで解決できるが、理解度とのバランスを
取っていかなければならない。
この研究を通して、いかに一つのプログラムに膨大の時間と努力がつぎ込まれていたのか実感できた。
また、今までのWWW上のキャンパス案内とはひと味違った、キャンパス案内ができる見通しが得られた。
結局、理解度とデータ量のバランスについて解決することができなかったが、今後、マシンパワーの充実、
圧縮技術の進歩によって解決の兆しが見えてくるのではないだろうか。
家庭用ゲーム機であるNECの「PCEngine」に、ユーザーがプログラムを行うことによってゲーム等
を開発できる「でべろ」というシステムがある。ゲームを開発する時は多くの画像を用意したいのだが、この
システムのために用いる画像は特殊な形式をしており、一般的な画像作成ソフトでは作成し難かった。そこ
で、このシステムの画像作成に適したソフトを卒業研究の課題として作成することにした。
作成するソフトは、Windowsで動作するものとし、これを開発するためにVisualC++6.0を使用した。論
文では始めに、でべろシステムで用いる画像の形式を明らかにするために、PCEngineの画像表示構造を
説明している。次に作成するソフトの基盤となる、Windowsの仕組みとプログラミングスタイル、さらにVisu
alC++の開発で利用できるスケルトンの説明をしている。その後、図形描画のためのアルゴリズムを説明
し、最後のまとめとした。
完成したプログラムは、でべろシステムの画像作成に適したものになり、直線、四角形、楕円などの簡単な
図形を描画することができた。卒業論文データベースには、この完成したプログラムと、開発に使用したワ
ークスペースを付録として付けておく
私の研究は競馬の予想である。競走馬のデータ(競馬新聞に載っているデータ等)を入力すると予
想結果が返ってくるプログラムを Visual Basic で作成する。この研究にしようと思ったきっかけは自分が競
馬を好きだったからであり、自分でプログラムを作ってみたいという願望があったからである。
目標はある程度の的中率を上げることだ。目標の目安として的中率を30%に設定した。また、どれだけ
当たっていても収支がマイナスなってしまっては意味がないので回収率100%以上というのも付け足してお
く。
そして作成した予想法にどのようにファジィを取り入れるのかを考えた。今回はペースを決めることにファジ
ィ推論を取り入れることを試みた。ファジィ推論とはファジィを使って結果を推測することである。
出来上がった予想法はまだ完成品と呼べるまでのものではないが一応目標は達成することができたの
で、これから発展させていく上での基礎になるものはできたと思っている。
自分が楽譜をみて演奏をする前に、コンピュータがその楽譜を認識し、演奏してくれれば、自分が演奏したい曲をイメージすることができ、練習時間の短縮へつなげることができる。このことから、実際に楽譜の認識をコンピュータがしてくれるソフトを自分の手で開発をしてみようと思い、この研究を始めた。
また、コンピュータが人間の代わりに楽譜を認識することで、まったく楽譜を理解できずに読めない人や、視覚に障害を持ち読むことのできない人に、楽譜上に書かれてある情報を実際の音楽として伝達できる。というメリットも本研究は持ち合わせている。
結局、「楽譜の認識・解析・演奏をコンピュータでおこなうためのソフトの開発」を目標として研究を開始したが、実際に始めてみると、楽譜の認識をおこなうためには解決すべき問題点が数多く存在していて、最終的にできたものは全体像の何分の1にも満たない「簡単な楽譜を製作する」くらいの初期的なものでしかなかった。より高度で完成されたソフトの開発を目指すためには様々な分野の知識も必要とされてくるので、一人でおこなうには限界もあり、目標の達成には届かなかった。
今回の研究は、今後の課題や反省すべき点が多くなってしまったが、得られることも多かったように思える。たとえば、目に映るものを解析するという、人が日常、何気なくこなしていることのあまりの複雑さを改めて気づかされた。
また、プログラムを組む上でVBを1から学び、基本的な構成ができるようになったということも、これからの自分にとって大きな財産になるであろう。