ポスター発表プログラム

口頭発表についても同じ日にポスター発表を予定しています。
2025年9月8日(月) 16:20 - 17:50 ポスターセッション1

[P101] 要素単位の凝集体再構成におけるテクスチャの合成に関する一実験

○村松 悠太 (法政大学), 佐藤 周平 (法政大学/プロメテックCGリサーチ)

概要
近年,画像からの3次元再構成技術が急速に発展しているが,ブドウの房のような凝集体を粒(要素)ごとに独立に再構成することは難しい.これに対し我々はこれまでに,画像から得た点群にジオメトリを考慮したクラスタリングを行うことで要素ごとに独立な再構成を実現する手法を提案した.このとき,入力となる画像群から各要素のテクスチャを得るが,いずれの画像にも写っていない箇所についてはテクスチャの情報が欠損してしまう.また,既存技術では要素ごとに単一のテクスチャが割り当てられるわけではないため,単純に欠損部分を補完するのは難しい.そこで本発表では,凝集体の再構成において要素ごとのテクスチャを得るための方法について実験する.具体的には,テクスチャ情報の転写と,欠損部分の補完により,全体が一つのテクスチャとして表現されている状態から,要素ごとに単一のテクスチャを合成する.

[P102] 骨格情報とLLMを用いた個別対応型姿勢評価手法

桂 陸登(静岡大学),岡部 誠(静岡大学)

概要
本研究では,ユーザが自身の理想とする姿勢を基準として登録しておき,30分ごとにその時点での姿勢と理想の姿勢を比較することで,姿勢の変化や崩れを検出,指摘するシステムを提案する.システム起動時,Webカメラを起動する.ユーザはまず座った状態で自身の理想の姿勢をとり,Enterキーを押す.すると,MediaPipeによりWebカメラの映像のみからJsonファイル形式で骨格情報が保存される.それから30分後,その時点の姿勢の骨格情報の保存が行われる.そして,保存された骨格情報はChatGPTに送信され,姿勢の評価と改善案の出力が行われる.以降,30分経過する度に,その時点の姿勢と理想の姿勢との比較評価が繰り返される.

[P103] オリエンテーリング向け仮想テレインのプロシージャル生成

松浦 萩太朗,江原 康生,河合 利幸(大阪電気通信大学)

概要
本研究は,オリエンテーリング向けVRトレーニングシステムの構築の内,地形モデルや仮想環境生成について述べる.オリエンテーリングで用いられる専用の地図にO-MAPがある.O-MAPには,微細な地形や植生,林の中などの走りやすさを表す走行可能度,道の太さなど,競技に必要な情報が記載されている,等高線からは,高さ情報を表すハイトマップを生成する.生成されたハイトマップ,植生の領域を表すマスクデータを作成し,地形モデルをUnity上でプロシージャルに生成する.

[P104] 織物デザインのための画像生成AIへのドメイン知識導入

○大谷 優羽 (山梨大学),ノヴァコフスキ カロル (山梨大学),豊浦 正広 (山梨大学)

概要
本研究では,織物デザインのために画像生成AIを用いる際に,ドメイン知識の導入によってプロンプト拡張を行う手法を提案する.画像生成AIの進展により,デザイナは自然言語による指示から画像を生成することができるようになった.しかし,画像生成AIによる生成画像の品質はプロンプトの精度に大きく依存しており,デザイナにとって適切なプロンプトを構築することは困難である.本研究では,この問題を解決するためにドメイン知識導入を行うことで,織物デザイン画像生成のためのプロンプトを適切に拡張するための新たな手法を報告する.定性的および定量的評価によって,単純なプロンプトやLLMの内部知識のみを活用して生成されたプロンプトによる織物デザインの画像生成結果よりも,提案手法により拡張したプロンプトの方が良好な生成結果を出力することを確かめた.

[P105] HTML Template Generation Using File Naming Based on the Luminance Information of Playing Cards

柾谷 明大(岩手県立大学)

概要
非公開

[P106] Generative-Prior-Driven Motion Artifact Correction in MRI

○Shuang Liang (The University of Tokyo), Takeshi Oishi (The University of Tokyo)

概要
非公開

[P107] Cross Modal Point Cloud Completion with Geometric Transformation

○Chuxiu Yu (Institute of Industrial Science, The University of Tokyo), Takeshi Oishi(Institute of Industrial Science, The University of Tokyo)

概要
Point cloud completion faces the persistent challenge of reconstructing high-fidelity, detail-rich point clouds with minimal computational cost. Unlike traditional unimodal methods, view-guided point cloud completion (VIPC) offers a promising alternative way by leveraging low-cost 2D images as supplementary information to enhance reconstruction details. This article introduces a deep learning network for the VIPC task by employing geometric priors, which we call VGTNet, meaning view-guided geometric transformation network. Our method consists of a CGTNet, which learns geometric transformations and predicts a coarse point cloud skeleton of missing regions, and a Refine Module that subsequently upsamples and refines this point skeleton. Compared with the traditional strategy of pure encoder-decoder based methods, our method can preserve more geometric details for generation. By effectively integrating the intrinsic geometric information of the point cloud with the supplementary structural cues provided by external 2D images, our method achieves high-quality global shape reconstruction and preserves fine-grained local details.

[P108] Sphere2Scene: Sparse Panoramic 3D Reconstruction With Gaussian Splatting

Zhisong Xu(Institute of Industrial Science, the University of Tokyo), Takeshi Oishi (Institute of Industrial Science, the University of Tokyo)

概要
Panoramic 3D reconstruction plays an increasingly critical role in immersive applications such as AR/VR and robotics. However, existing pipelines based on Structure-from-Motion (SfM) and 3D Gaussian Splatting (3DGS) struggle when applied to panoramic imagery, particularly under sparse-view conditions. In this paper, we present S2GS, a novel SfM-free reconstruction framework that bridges panoramic inputs with 3DGS. Our method leverages cubemap projections to alleviate distortion and employs pretrained models for efficient depth and camera pose estimation. We further introduce a transition plane formulation and intra-to-inter face optimization to improve 3D Gaussian consistency across cube faces. Additionally, we propose a spherical sampling strategy to ensure seamless rendering across face boundaries. Extensive experiments on three real-world panoramic datasets---Rico360, OmniPhotos, and OmniScene---demonstrate that S2GS achieves state-of-the-art reconstruction quality with significantly fewer input views.

[P109] 球面調和関数を利用したSGGXマイクロフレーク散乱位相関数の解析計算法

○張 汀雨 (埼玉大学大学院理工学研究科), 岩崎 慶 (埼玉大学大学院理工学研究科)

概要
本研究では、球面調和関数展開に基づくSGGXマイクロフレーク散乱位相関数の解析計算手法を提案する。 SGGXマイクロフレーク分布は織物などの材質を微小薄片の集合体として表現し、拡散反射の場合、位相関数はマイクロフレーク法線分布と入射・出射方向の余弦値積の積分として定式化される。 従来手法では積分計算にモンテカルロサンプリングを用いていたが、分散ノイズが発生しレンダリング品質に影響していた。本研究では球面調和関数による解析的求解手法を開発し、ノイズを完全に排除した決定論的計算を実現する。数値積分との比較により本手法の精度を実証し、リアルタイムレンダリングへの適用可能性を示す。

[P110] イベント発生時刻の二分探索に基づくイベントカメラの高時間分解能シミュレーション

○真鍋 悠一郎 (千葉大学), 谷田川 達也 (一橋大学), 森島 繁生 (早稲田大学), 久保 尋之 (千葉大学)

概要
本研究では,パストレーシング法を用いたイベントカメラの再現手法を提案する. イベントカメラは,画素ごとに輝度の時間変化(イベント)を検出でき,通常のカメラより高い時間分解能を有する. 本研究では,各画素で非同期に輝度が変化する時刻を二分探索により検出し,イベントカメラのシミュレーションによる再現において,従来法より高い時間分解能を実現する. 加えて,輝度の時間変化の有無を仮説検定によって判断し,変化が生じない時間を枝刈りして探索を効率化する. 提案法は,従来法より高い時間分解能でイベントカメラを再現しながら,探索を行わず全時点で差分を求めた場合と比較して約5〜9倍高速である.

[P111] Euler Bézier spiralとEuler B-spline spiralのG^1 Hermite補間の高速化

○佐々木 楽(日本大学),井上 大成(日本大学),吉田 典正(日本大学),斎藤 隆文(東京農工大学)

概要
Euler Bézier/B-spline spiralは,Yangによって提案されたEuler spiral(Clothoid曲線)を近似する多項式Bézier/B-spline曲線である.YangはG^1 Hermite補間を実現するために繰り返し計算に基づくスムージング手法を用いている.本研究では,Euler spiralの性質を利用し,二分法を拡張したシンプルな手法で、Euler Bézier/B-spline spiralの G^1 Hermite補間を行う手法を提案する。Euler Bézier spiralに関する結果では、Yangの手法よりも100倍以上高速に生成できる場合があることを確認した。

[P112] 画像認識AIを用いたピアノ鍵盤領域の自動検出と音名のバーチャルラベリング

○渥美 天真(神戸大学)、黒木 修隆(神戸大学)、沼 昌宏(神戸大学)

概要
従来のピアノの鍵盤認識技術は、カメラの固定や手動での鍵盤位置調整が必要で、コストと利便性に課題があった。そこで、それらを要することなく「映像のみ」から自動でラベリングをすることを目的として研究を行った。提案手法では、画像認識AIであるYOLOを用いて、鍵盤の位置とオクターブ周期を検出し、その情報に基づいて音名のラベリングを行った。その結果、ピアノの傾きや画像の歪みがあっても9割を超える精度でラベリングが可能となった。本アルゴリズムをPC上に実装し、リアルタイムで動作することを確認した。

[P113] VRにおける色の違いが協調タスクに与える影響

○渡辺 駿(東京電機大学),小篠 裕子(東京電機大学)

概要
VR環境における非対称な協調タスクに関する研究では,これまで主にデバイスや役割の差異による非対称性が扱われてきた.しかし,VR環境で共有されるオブジェクトの色の違いによる非対称性に関する研究は十分に行われていない.そこで本研究では,VR環境で実行される協調タスクにおいて,色の違いが参加者のコミュニケーションとタスクパフォーマンスに与える影響を検証する.

[P114] コサインローブを用いた多角形指向性光源のリアルタイムシェーディング

○徐 明鋭 (埼玉大学), 岩崎 慶(埼玉大学/プロメテックCGリサーチ)

概要
非公開

[P115] 空間スケーラビリティを備えた自己回帰モデルによる大規模地形生成

○金井 俊樹, 金森 由博, 遠藤 結城 (筑波大学)

概要
地理画像生成において、生成モデルが様々な空間サイズを扱えることは重要である。しかし既存の画像生成モデルは訓練時よりも広範囲の画像を直接生成できない。そこで本研究では、可変長シーケンスを扱う自然言語処理に着想を得た、空間スケーラビリティを備えた生成モデルを提案する。具体的には、Mamba による次元独立な特徴抽出と、大域的特徴を捉える独自の Feature Fusion メカニズムに基づく自己回帰型の生成モデルを設計する。設計した生成モデルを高さマップ生成に適用し、提案手法が訓練時よりも広範囲の画像を直接生成できることを示す。

[P116] 車線変更・高速合流時におけるARを用いたBSMの有効性の検証

○酒井 耀平 (東洋大学), 石川 知一 (東洋大学/プロメテックCGリサーチ)

概要
近年、車線変更や高速合流時の安全性向上を目的とした運転支援システムの研究が盛んに行われている。特に、周囲車両の認知不足による事故が多いことから、ドライバの注意配分を適切に誘導する手法が求められている。 本研究では、ブラインドスポットモニター(BSM)の多様な情報提示の方法が、車線変更や高速合流時のドライバの視線行動および主観的負荷に与える影響を明らかにすることを目的とする。 そのために、VR技術を用いた運転シミュレータをUnity上でNWH Vehicle Physics 2を用いて走行環境を構築し、HTC Vive Pro Eyeによるアイトラッキングを導入した。実験では、一般道、高速合流、渋滞路の3シナリオを設定し、BSMの提示位置として、従来型のドアミラー、メータパネル、そしてAR(拡張現実)技術で車両側方に壁状の警告を提示する3手法を評価した。 被験者のブラインドスポット非注視時間やミラーへの注視頻度を計測するとともに、RAW-TLXを用いて主観的作業負荷を評価した。

[P117] Signaling Letter: Visualizing Handwriting Dynamics with a Paper-Embedded Microphone

Kosuke Shimizu(University of Tsukuba) Honoka Kawachino(The University of Tokyo) Shohei Komatsu(The University of Tokyo)

概要
Letters remain a traditional medium despite email and social media, yet the temporal micro-dynamics of writing—hesitation, pressure, speed—vanish in static ink
We frame handwriting as a spatiotemporal signal and turn the letter itself into the playback surface, adopting a Research through Design stance that uses crafted artifacts to probe new interaction possibilities
Signaling Letter is a paper-based interface with a page-embedded microphone and microcontroller that records pen-on-paper acoustics in real time and replays them on the letter via a thin piezo transducer and an LED line along the ruled margin
Short-window audio features—e.g., the spectral centroid—drive “light breathing,” flashes, and faint textures of sound so that the act of writing is sensorially enveloped into the artifact and resurfaces during reading; the approach leverages paper electronics as a functional substrate while preserving familiar affordances, and rests on evidence that friction-sound characteristics correlate with writing kinematics
Through preliminary design explorations, we discuss interaction opportunities for visualizing how a writer’s heart is translated into a letter, aiming to evoke positive affect in recipients while maintaining the intimacy and legibility of the handwritten form

[P118] 微分可能レンダリングを用いた金属表面上の傷の視認性向上描画法

茂木 俊哉(千葉大学), 舩冨 卓哉,藤村 友貴,向川 康博(奈良先端科学技術大学院大学),高柳 亜紀,菊田 勇人(三菱電機),久保 尋之(千葉大学)

概要
金属の切削加工では,切削面に傷が発生することが多く,品質を確保するために職人による目視の外観検査が必要とされている.従来,この外観検査は実際に金属製品のプロトタイプを切削して行われていたが,この方法は時間コスト及び材料コストの両面で非効率であった.そこで近年では,CGを用いたデジタルツイン技術が注目されており,仮想空間上で切削シミュレーションデータをレンダリングし,その結果をもとに外観検査を行うことが増えている.本研究では,Mitsuba3の微分可能レンダリングを活用して環境マップ光源を最適化することで,物理ベースで切削傷の視認性を向上させるレンダリング手法を提案する.切削傷を画像空間における輝度勾配としてモデル化し,最適化の目的関数として隣接ピクセル間の輝度勾配最大化と,それによる輝度値の過剰な増加を抑制するL2正則化を組み込んだ.実験の結果,本手法が切削傷の視認性向上に有効であることが示された.また,この結果は被験者による定性評価と仮説検定を通じて,統計的に有意であることが確認された.

[P119] 照明効果最適化によるランプシェード設計手法の検討

○中筋浩央, 大竹豊, 小山裕己(東京大学)

概要
本研究では、目的とする光学的機能を備えた自由形状ランプシェードを計算的に設計する手法を提案する。従来のランプシェードは単純な形状が多く、複雑な外形ではシェード全体を一様に光らせるなどの照明効果の制御が難しかった。そこで我々は、微分可能レンダリングを用いて照明効果を制御し、3Dプリント可能なシェードを設計することを目指す。本発表では、ランプシェードの内部空洞の形状を最適化することで一様な発光を実現することを目指した実験結果について報告する。今後は光源の数、位置、材質の分布なども設計変数に含めて、より広い照明効果の扱いについても検討を進める。

[P120] アニメーション制作補助を目的とした2原画間補間のための線の対応付についての研究

○佐藤 歩(東京科学大学), 齋藤 豪(東京科学大学)

概要
非公開

[P121] LLMを用いてネタバレ回避をしながらパーソナライズされたストーリー解説を提示する動画視聴支援システム

○植野 天翔 (駒澤大学), 青柳 西蔵 (駒澤大学), 平井 辰典 (駒澤大学)

概要
本研究では,アニメやドラマの複雑なストーリー展開によって内容を理解しにくくなる課題を解決するために,LLMを用いたネタバレを避けながらパーソナライズされたストーリー解説を提示する動画視聴支援システムを提案する.本手法では,LLMを用いて字幕とあらすじ記事からタイムスタンプ付きあらすじを自動生成し,対応するシーン画像と統合してLLMに入力することで,ネタバレを含まない解説を生成する.さらに,解説に対する評価を収集し,LLMが分析することで,語彙や解説の分量,知識補完等の度合いを調整し,次回以降の解説をパーソナライズする.これにより,作品理解を補助しつつ没入感を維持する新しい動画視聴支援を実現する.

[P122] 時間的一貫性を考慮した人物全身動画の再照明における影の再現

○田島 大地, 金森 由博, 遠藤 結城 (筑波大学)

概要
人物全身動画の再照明では,各フレームを独立に処理すると時間的一貫性が失われ,影にチラつきが生じる.既存の3Dアバター復元手法では,衣服の変形を扱えない上,入力動画との画素レベルのアラインメントが難しい.本研究では,画素レベルのアラインメントを取りつつ,時間的に一貫した影を再現する新たな再照明手法を提案する.時間的一貫性を考慮したニューラルネットで深度マップを推定し,深度情報に基づきシャドウマッピングで影を計算する.さらに,パラメトリックな照明による影制御と,深度マップ由来の影の欠損を埋めるネットワークを適用する.本手法により,計算コストを抑えつつ,長尺動画でも一貫した再照明を可能にする.

[P123] 配光特性を考慮したスポットライト光跡の高速描画

稲垣壮冴(北海道大学 大学院情報科学院), 土橋宜典(北海道大学 大学院情報科学院/プロメテックCGリサーチ)

概要
近年、ゲームや映像分野では光源のリアルな表現が求められているが、配光特性を考慮したスポットライトによる光跡のレンダリングは計算コストが高いという課題がある。本研究では、配光特性をテクスチャとして表現し、視点に到達する光の強度は、散乱光と配光強度の積の積分をそれぞれの積分の積で近似する手法を提案する。これにより、自然なスポットライト表現を維持しながら、高速な描画を可能にする。

2025年9月9日(火) 16:30 - 18:00 ポスターセッション2

[P201] 三次元再構成を目的とした多面体結晶の画像のセグメンテーションに関する一実験

○桐原 暖人, 津田 康汰 (法政大学), 佐藤 周平 (法政大学/プロメテックCGリサーチ)

概要
本研究では,多面体結晶を画像から三次元再構成することを目的としている.その一つのアプローチとして,画像中の結晶の形状に合うよう,結晶の成長シミュレーションのパラメータを最適化することを検討している.そのために,画像中に存在する結晶を個別に抽出するセグメンテーション手法を確立する必要がある.そこで本稿では,汎用的なセグメンテーションモデルであるSAM2に対して,CGにより作成した複数の結晶および母岩が混在する合成画像を用いてファインチューニングする.そして学習後のモデルが,母岩および結晶を個別にセグメンテーションできるか検証したので,その結果について報告する.

[P202] ラプラシアンピラミッドを用いた階層的な Triplanar テクスチャブレンディング

横田 壮真(筑波大学)

概要
Triplanar マッピングは,UV 展開を必要としないテクスチャ投影手法として知られており,ゲームなどのリアルタイムグラフィックス分野で活用されている.しかし,この手法には,軸間の境目に継ぎ目が発生し,視覚的なアーティファクトが発生するという課題がある.本研究では,テクスチャのラプラシアンピラミッドを作成し,各階層ごとに異なる重みでテクスチャをブレンドする手法を提案する.構造的な一貫性を保ちつつ,階層ごとにテクスチャを合成することで,高周波帯域での不整合を抑制しつつ,全体の連続性を保つマッピングを可能にする.

[P203] 部分空間における超楕円体への射影を用いた Projective Dynamics の高速化

○佐藤 輔 (早稲田大学), 谷田川 達也 (一橋大学), 森島 繁生 (早稲田大学)

概要
本稿は,弾性体シミュレーションの代表的な手法である Projective Dynamics (PD) に対し,部分空間における超楕円体への射影に基づく高速化を提案する.従来,Hyper-Reduced Projective Dynamics をはじめとする PD の高速化手法は,処理速度と引き換えに弾性体の幾何的な詳細情報が失われる問題があった.提案手法では,PD の陰的な時間積分の解が部分空間における超楕円体への射影により近似的に計算可能であることに着目し,部分空間の構成に依存しない PD の高速化を実現する.本稿では,従来の PD で扱われる物体の歪みや曲げといった物理拘束に対して提案手法が十分な再現性を持つことを示す.

[P204] 不確実性を利用したノイズに頑健なX線画像群からの 三次元再構成

○成松寛久郎(東京大学生産技術研究所),石川涼一(東京大学生産技術研究所),影沢政隆(東京大学生産技術研究所),大石岳史(東京大学生産技術研究所)

概要
X線画像を用いた3次元再構成は医療分野や産業分野において有用な技術であるが,複数方向からのX線画像撮影が必要となるため被ばく量の問題は避けられない. そのため近年,インプリシットニューラル表現を用いて少数枚のX線画像を用いた手法が提案されている. しかし,より被ばく量を軽減するためには,照射する線量を低下させる必要があり,撮影されたX線画像中に含まれるショットノイズや熱雑音が大きな問題となる. そこで本稿では低線量画像からの再構成時に,不確実性を考慮した手法と,複数の再構成結果を用いたデノイズ手法を組み合わせることによって,3次元再構成の性能を向上させる手法を提案する. 提案手法では,3次元空間上の各点の減衰係数とその不確実性パラメータを同時に推定し,それらの積分によって,ある視線に対応する画素の期待値と分散を計算する. これらの値をガウシアン分布の尤度関数に基づいて最適化することによってノイズを抑制することが可能となる. また,再構成結果そのものの不定性に着目し,再構成の複数回試行によって得られるデータから筋体したノイズモデルを用いて入力画像をデノイズすることによって3次元再構成の精度を向上させる.

[P205] 物理ベースの氷・霜シミュレーションにおける所望の形状への成長制御に関する一実験

○市村 侑大 (法政大学), 佐藤 周平 (法政大学/プロメテックCGリサーチ)

概要
本研究では,氷や霜といった樹枝状結晶のシミュレーションに焦点をあて,ユーザの指定した形状どおりに制御する手法を提案する.我々の手法では,ユーザが所望の形状および氷・霜が成長してほしい軌道を指定し,それらに沿うよう氷・霜の成長シミュレーションを制御する.これは,ユーザの指定した形状を基に外力を生成し,それを用いて温度場や水滴を表す粒子の挙動を制御することで実現する.ただし外力のみでは,形状の外側まで結晶が成長してしまう場合がある.そこで,氷・霜の凝固点を表すマップの値を,目標の形状に従って設定する.提案手法により,指定の形状を指定の軌跡に沿って成長するような氷・霜のアニメーションを生成できる.

[P206] 動的流体現象のデジタル可視化とデジタルツイン空間再現に向けた統合的アプローチ

エムペラド ケイジ ノエル(東京工科大学),生野 壮一郎(東京工科大学/デジタルツインセンター)

概要
本稿は,デジタルツイン技術により得られる膨大なデータを,工学技術者が直感的に活用できる形式として提供し,物理現象の全体像を没入的に理解可能な環境を実現することを目的とする.そこで,現実構造を再現した3Dモデルと数値流体解析による物理データを統合し,仮想空間上で視覚的に提示する環境を構築する.これにより,従来の静的な3D表示では困難だった流れの全体像や局所的な渦構造の理解を支援し,専門的な知識を有さない利用者にも分かりやすい情報提供が可能となることを示す.本アプローチは,建築設計や室内環境の評価におけるデジタルツイン活用の実効性を高めるものであると云える.

[P207] 大気エアロゾルの粒径分布を考慮した遠景の再現

大貫 誉(慶應義塾大学),横田 壮真(筑波大学),小林 拓(山梨大学),藤代 一成(慶應義塾大学)

概要
大気汚染は世界中で大きな問題となっている.黄砂やPM2.5 などの大気エアロゾルは,人間の健康に影響を及ぼすだけでなく,視程や大気の色合いにも影響を及ぼす.大気エアロゾルを考慮したシーンのレンダリングは多々提案されているが,汚染物質の種類によって変化する視程や大気の色合いを考慮したレンダリングについては十分な研究がなされていない.本稿で提案する手法は,Polarization Optical Particle Counter(偏光光散乱式粒子計測器)による大気エアロゾルの測定データを利用して消散係数を計算し,多重散乱を考慮した大域照明を評価したうえでスペクトラルレンダリングを実行することで,実際の汚染物質の粒径分布にしたがって視程や色合いの変化を伴う遠景の再現を試みる.

[P208] マルチポイント慣性センサーとニューラルネットワークを用いたドリフトに強いその場での歩行(WIP)認識

○髙橋 悠 (東洋大学), 石川 知一 (東洋大学)

概要
その場での歩行(Walking-in-Place: WIP)技術は、ユーザーが物理的に移動することなく仮想現実(VR)空間内を自然に歩き回ることを可能にし、従来のコントローラー操作で起こりがちなVR酔いを軽減する技術である。しかし、既存のWIP技術は、実環境での認識精度が低い、あるいはリアルタイム性を損なうほど長い認識時間を要するなど、実用化に向けた課題を抱えている。 本研究では、慣性センサーを用いた足踏み動作認識による、新たなVR移動手法を提案する。この手法では、6点の慣性センサーを用いて全身の動作データを取得し、短い時間窓(0.64秒)で動作を認識する効率化された単一ストリームのCNN(畳み込みニューラルネットワーク)アーキテクチャを採用している。また、センサーの長時間利用時に問題となる座標のドリフト(累積誤差)を解決するため、生の位置データではなく、そこから算出した速度と加速度を特徴量として入力に用いることで、リアルタイム性を維持しつつ高い認識精度を実現した。 提案手法の有効性を検証するために独自開発したランナーゲームを用いた評価実験では、キーボード操作に匹敵する実用的な操作が可能であることが示された。さらに、被験者評価では、操作の直感性や没入感の高さが確認された。本研究は、高精度な動作認識とVRアプリケーションの実用化との間にあった隔たりを埋め、限られた物理スペースでも自然な移動を可能にする、実用的な解決策を提示するものである。

[P209] Color-informed Anime Graph Inbetweening

久野証(株式会社EQUES/東京大学情報理工学系研究科)

概要
We present Color-informed Anime Graph Inbetweening, a palette-aware extension of AnimeInbet's vector-graph inbetweening pipeline
By attaching compact color descriptors to every contour vertex, our method lets a lightweight correspondence Transformer reason jointly about geometry and chromatic context, generating temporally consistent intermediate frames without modifying downstream modules
To supply reliable palette cues, we colorized the MixamoLine240 corpus and release the result as the first open benchmark for color-aware inbetweening
Experiments show that incorporating palette information modestly but consistently improves vertex-matching accuracy (0.002) and visibly reduces mismatches between similarly shaped yet differently colored parts
The results suggest that even simple color embeddings enhance graph-based animation pipelines and open avenues for multi-scale palette reasoning and hybrid diffusion–graph generators

[P210] 拡散モデルを用いたスケッチベース錆テクスチャの生成手法

張 永銘(北陸先端科学技術大学院大学), イーチャオ シェン(東京大学), 謝 浩然(北陸先端科学技術大学院大学)

概要
本研究では、ユーザースケッチ入力に基づき、複雑な錆テクスチャを生成する二段階の生成フレームワークを提案する。まず、実写画像に対して色飽和度と局所テクスチャ特徴量を利用した教師なし階層的セグメンテーション手法を提案し、腐食度を多段階に表現した制御マップを自動で抽出する。第一段階では、敵対的生成ネットワークを用いて入力スケッチから制御マップを生成する。第二段階では、制御マップをガイドとして条件付き拡散モデルを用いて錆テクスチャを生成する。評価実験では、ユーザーの設計意図に沿った大域的な形状と、錆固有の局所的な質感表現を達成させることで手法の有効性を検証した。

[P211] LayerPack: トレーニング不要なレイヤー間一貫性のある中割り手法

丸山 敦史(東京大学) 古賀 荘翠(NAIST) 前島 謙宣(OLM Digital, Inc., IMAGICA GROUP Inc.) 小山 裕己(東京大学) I-Chao Shen(東京大学) 五十嵐 健夫(東京大学)

概要
アニメーション制作において、キーフレーム間を補間する中割り作業は多大な労力を要する工程である。近年、中割りを対象とした拡散モデルが研究され、良好な結果を示している。実際のアニメ制作現場では、アルファブレンディングによる合成を前提としたレイヤー分けデータが広く利用されており、レイヤーごとの中割り結果が合成後に同期していることが不可欠である。拡散モデルをレイヤーごとに適用する場合、透明度の扱いが難しいことや多レイヤーのデータセットが存在しないことから、各レイヤーが同期しないという課題が生じる。本研究では、これらの課題に対処するため、学習を必要とせずに複数レイヤーを同期させた中割りを実現するモデル拡張手法LayerPackを提案する。LayerPackは入力画像を空間方向のグリッド状に拡張するというシンプルな方法ながら、高い効果を発揮する。定性的な観察および定量的な評価を通じて、LayerPackが従来のレイヤー別生成よりも高品質な結果を達成することを示す。

[P212] GPU work graphを利用した適応的マーチングキューブ法の検討

○宮下 慧悟 (慶應義塾大学), 藤代 一成 (慶應義塾大学)

概要
非公開

[P213] 魚眼パッチ構造による周辺情報を考慮したアニメ線画への自動着色手法

○高村 亮佑(千葉大学), 渡邉 大起(千葉大学), 前島 謙宣(株式会社オー・エル・エム・デジタル / 株式会社IMAGICA GROUP), 品川 政太朗(奈良先端科学技術大学院大学), 舩冨 卓哉(奈良先端科学技術大学院大学), 向川 康博(奈良先端科学技術大学院大学), 森島 繁生(早稲田大学), 久保 尋之(千葉大学)

概要
アニメ線画の自動着色では、パッチベース学習が用いられる一方、ごく小さな領域や線が少ない領域ではパッチ内の情報量が少なく、着色の精度が低下する課題がある。 本研究では、着色対象となる領域の中央部分は元の解像度で保持しつつ、その周囲の参照領域を距離に依存する圧縮サンプリングで取得する「魚眼パッチ構造」を提案する。これにより、詳細情報と広域の文脈情報を効率良く入力することができ、着色精度の向上が可能となる。評価実験では、特に線画が疎な領域において視覚的一貫性が大きく向上し、本手法の有効性を示した。

[P214] 有機ELディスプレイの発熱特性に基づいた可視-熱領域の同時映像制御

進藤 羽流 (千葉大学), 舩冨 卓哉 (京都大学), 前島 謙宣 (OLM Digital/IMAGICA GROUP), 向川 康博 (奈良先端科学技術大学院大学), 久保 尋之 (千葉大学)

概要
本研究では,有機ELディスプレイを用いて可視領域と熱領域で異なる映像を同時に制御・表示する手法を提案する.自発光方式である有機ELディスプレイは,各画素に表示する輝度値と時間に依存して温度が変化する.この特性を応用し,画素単位の発熱を調節して,サーマルカメラで撮影可能な熱領域の映像を制御できることに気がついた.そこで本手法では,有機ELディスプレイに表示する輝度に対する温度変化の時間的な応答特性を測定し,その結果を用いて,可視領域と熱領域において独立に制御した異なる映像の表示を実現する.2つの波長域で異なる映像を表示することで,二層構造の映像表現や目に見えないマーカーへの活用が期待される.

[P215] 3D姿勢推定を用いた人間動作の動画からのキーフレーム抽出

○小此木 隼翔(東京都立大学),我妻 ひより(東京都立大学),向井 智彦(東京都立大学)

概要
動画からのキーフレーム抽出は、特に動作認識や動画要約など、幅広い応用分野を有している。本研究では、3D姿勢推定を用いた人間動作の動画からのキーフレーム抽出システムを提案する。従来の2次元画面空間で動作する手法と比べ、当システムの3Dベースのアプローチは、動作の意味をより的確に表すキーフレームを抽出可能である。

[P216] パーツのサイズが大きく異なる3Dモデルへのモーションリターゲティングに関する一検討

小倉 千佳 (法政大学), ○佐藤 周平 (法政大学/プロメテックCGリサーチ)

概要
キャラクタアニメーションの分野では,モーションキャプチャなどから得られたモーションデータを3Dモデルに割り当ててアニメーションを生成する.しかし,元データと体格が異なる場合にはそのまま適用できないため,リターゲティングが必要となる.特にパーツ間の相対的なサイズ差が大きい場合,例えば頭部が大きく腕が短いぬいぐるみのようなモデルに人間のモーションを当てはめると,腕が頭部にめり込むなどの問題が生じる場合がある.本研究では,このようにパーツのサイズが大きく異なる3Dモデルに対して適切にリターゲティングする手法の開発を目的とする.初期的な試みとして,本発表ではターゲットモデルのパーツ位置関係に基づいてボーン位置を補正する実験を行い,その結果を報告する.

[P217] 大規模視覚言語モデルを活用したシュートシーン解説の自動生成

片山 葉一朗 (筑波大学), 伏見 龍樹 (筑波大学), 落合 陽一 (筑波大学)

概要
サッカー中継の解説は、「スペースを空ける動き」といったサッカー未経験者には理解しづらい表現が使用されるなど、サッカーをより詳しく理解し楽しみたい初学者には向かず、一方解説者の仕事は専門性が高いため解説者を増やすことは難しい。自動化のアプローチとして解説の可視化のサポートツールや選手の認識などは実現しているが、表面的な情報だけではなく戦略・戦術を含めた解説の自動生成は実現していない。そこで、本研究ではサッカー初学者向けに丁寧な解説の自動生成を目指す。特にシュートシーンのハイライト動画に対して、シュートの要因検出と映像入力可能なLLM(VLM)を利用し、解説生成と可視化までを行う。

[P218] ガラスケース内物体を対象とした反射・屈折を考慮するNeRFの高精度化

○椋本祐輔(東京大学), 金佑錫 (東京大学), 吹上大樹 (NTT), 大石岳史(東京大学)

概要
本研究では、反射や屈折を含む複雑なガラスケース内の物体を対象として、より高精度かつ安定的に学習可能な新規視点合成を実現する手法を提案する。提案手法は、屈折の学習と反射成分の分離機構を備えた既存のNeRFベースモデルを基盤とし、新たに成分分離を促す損失関数を導入することで反射分離の学習の安定性を向上させる。さらに、周波数を段階的に解放する位置符号化の正則化と、光線サンプリング数の拡張を組み合わせることで、屈折変位推定のランダム性を低減し、より安定的な屈折効果の学習を実現する。 シミュレーション実験では、従来手法に比べて大幅に高い学習成功率を達成した。また実写シーンにおいても、カメラ姿勢と屈折変位の交互最適化を行うことで、より高精度な新規視点合成が可能であることを確認した。さらに、学習済みNeRFを用いて反射・屈折成分を除去した画像から3D Gaussian Splattingを学習することで、ガラスの影響を抑えつつ、高速なレンダリングが実現できることを示した。

[P219] 2Dアニメーション制作のための事前生成中割り探索

坂宮 丞太郎(東京大学),前島 謙宣(OLM Digital, Inc./IMAGICA GROUP Inc.), 小山 裕己(東京大学), I-Chao Shen(東京大学), 五十嵐 健夫(東京大学)

概要
本研究は、2Dアニメーション制作における中割り作業を効率化するため、動画生成モデルと特徴点追跡を組み合わせた中割り探索支援システムを提案する。従来の生成モデルは多様な中割りを出力できる一方、ユーザが意図した結果が生成されるまで繰り返し生成を行う必要があり非効率であった。本手法では、動画生成モデルで多数の候補を事前生成し、各候補に特徴点追跡を適用して軌跡を抽出する。ユーザはインタフェース上で特徴点を選択し、中割り候補と対応する軌跡を確認し比較できる。これにより、ユーザは多様な中割りをリアルタイムに探索し、意図に沿った候補を効率的に得られる。

2025年9月10日(水) 14:10 - 15:40 ポスターセッション3

[P301] 2Dアクションゲームにおける攻撃ヒット演出がプレイヤー体験に与える影響の分析

○関 将輝(東洋大学), 石川知一(東洋大学)

概要
本研究では、2D横スクロールアクションゲームにおける「攻撃ヒット時の演出」がプレイヤー体験に与える影響について調査する。Unityを用いて、近距離攻撃・近距離チャージ攻撃・遠距離攻撃・遠距離チャージ攻撃の4種の攻撃に対応する演出(ヒットストップ、カメラ揺れ、視覚的演出の大きさなど)をスライダーで調整可能な実験用ゲームを制作し、実験参加者にプレイしてもらった。それぞれの実験参加者が「気持ちよい」、「しっくりくる」と感じる演出の強さを自由に調整してもらい、その設定値を記録・分析した。得られたデータを通じて、演出の種類や攻撃手法との関係、没入感・達成感に対する傾向を考察し、今後の演出設計における指針を提案する。

[P302] 線色対応表を用いた彩色済みアニメ画像からの色トレス線付き線画生成

八木壮太(千葉大学),高村亮佑(千葉大学),渡邉大起(千葉大学),前島謙宣(OLM Digital/IMAGICA GROUP),久保尋之(千葉大学)

概要
本研究では,彩色済みアニメ画像から色トレス線付き線画を自動生成する手法を提案する.従来,アニメデータセットには彩色済み画像が含まれる一方で,自動彩色モデルなどの学習に必要な線画データは含まれていないことが多い.そこで,彩色済み画像から主線を抽出することで,線画データを生成する手法を提案する.さらに,異なる色の領域の境界から線を検出し,その色の組み合わせに基づいて定義された線色対応表を用いることで,主線だけでなく適切な色トレス線を自動で付与することが可能となる.本手法により,アニメ線画を対象とした様々な学習モデルの構築に貢献することが期待できる.

[P303] 多人数空間共有に適した分散レンダリングにおける動的描画制御手法の遅延評価

○山田朝陽(東京科学大学),齋藤豪(東京科学大学)

概要
多人数が同一の仮想空間を共有するアプリケーションでは, アバタの数や複雑さにより, ユーザ端末での描画が困難になる
我々はこれまでに, サーバサイドの画像ベース分散レンダリングにおいて, あるアバタを類似した方向から見ている複数のユーザ間でそのアバタの部分画像を共有し, アバタの描画回数を削減する手法を提案してきた
本発表では、この提案手法が各モデルの描画頻度を安定的に維持し, システム全体の遅延低減を実現するかを検証すべく行った実装とその計測実験結果を報告する

[P304] Generative In-between Line-drawing Interpolation

○Liang Kong (Institute of Science Tokyo), Suguru Saito (Institute of Science Tokyo)

概要
Anime’s low frame rates and non-linear motion present unique challenges for interpolation
Existing optical flow-based methods generate deterministic outputs but suffer from interpolating extreme motions
While diffusion-based generative models yield better results in large motions, the computational costs and semantic errors generated are difficult to ignore
This work explores the possibility of incorporating a generative optical flow network into a traditional warp-and-synthesis frame interpolation network with the aim of embracing the merits of both
The proposed LineDiff framework, designed specifically for line-drawing data, demonstrates enhanced learning and generalization capabilities

[P305] 分散レンダリングシステムにおけるデュアルカメラを用いたスクリーンスペースレイトレーシングの拡張

○杜 心語(東京科学大学)、山田 朝陽(東京科学大学)、齋藤 豪(東京科学大学)

概要
スクリーンスペースレイトレーシング(SSR)は、カメラから見えないオブジェクトの反射は考慮できない。したがって、カメラに相対する鏡を実現するためには、カメラに映るシーン情報だけでは不十分である。 本研究では、分散レンダリングフレームワーク上にデュアルカメラ方式を提案する。メインカメラに加え、背面情報を取得するサブカメラを導入し、モデル描画サーバで両カメラの G-Buffer を生成し、MPI を介して合成サーバで合成する。これにより、SSR の反射表現を拡張しつつリアルタイム性を維持する。

[P306] 地形形状最適化によるSPH定常流の編集手法

〇木村 悠希(北海道大学), 佐藤 周平 (法政大学/プロメテックCGリサーチ), 土橋 宜典(北海道大学/プロメテックCGリサーチ)

概要
本稿では,地形形状の逐次的な最適化に基づくSPH定常流の編集手法を提案する.提案法では,ユーザが目標軌道を曲線として指定し,そこから等間隔にサンプリングした点群を制御目標とする.各最適化ステップにおいて,目標点近傍の粒子群の重心が目標点に近づくように,選択された地形面の法線を更新する.その後,更新された法線条件を満たすようにポアソン方程式を構築し,数値的に解くことで地形ハイトマップを再構成する.この最適化を反復的に適用することで流体の挙動は徐々に目標軌道に適合し,河川や滝などの定常的な流れを,物理的整合性を維持したまま直感的に編集することができる.

[P308] 質量保存を達成する仮想絵具のリアルタイム表面流計算法

阪口丈瑠(東京科学大学), 齋藤豪(東京科学大学)

概要
デジタル画材である仮想絵具への応用を目的としたリアルタイム流体シミュレーション手法を提案する. 絵具の発色特性は質量保存性に敏感であるため, 高精度な質量保存が求められる. ところが, 従来の仮想絵具計算法では質量保存性が十分に考慮されていない. 本研究では, リアルタイム性と質量保存精度の両立を目指し, 仮想絵具表現に適した計算モデルを構築する. 2次元格子上で浅水方程式を用いたシミュレーションを行い, 計算効率の高い有限差分法を採用する. さらに, CIP-CSLに基づく手法によって十分な質量保存を達成する.

[P309] アニメ制作におけるワークフローとリテイク工程のデジタル化に伴う中間生成物の自動蓄積システムの提案

○Steven Arulpragasam(東京科学大学), 新穂 壮真(東京科学大学), 齋藤 豪(東京科学大学)

概要
アニメ制作において絵コンテや原画、タイムシートなどの中間生成物の蓄積は新人教育、続編の制作、さらには画面構成の練習などの点から最も重要な要素の一つとされている。その中でも特に価値が高いとされているのが「リテイク作業(修正工程)」の中で、監督や演出からのフィードバックをもとに生み出された中間生成物である。 本発表ではこの工程に着目し、制作管理の効率化と中間生成物の自動保存を目的とする渕上らの既存システムを拡張する。私たちのシステムでは、レビュアが自由に描き込みやコメントを行えるインタフェースを実装した。この実装方針は、従来のアナログなフィードバック方法を再現するものであり、アーティストにとって直感的で扱いやすく、オンラインでの共同作業への移行をスムーズにすることを目指している。

[P310] 球面上のvon Mises-Fisher分布の数値的に安定した実装

○德吉 雄介 (Advacned Micro Devices, Inc.)

概要
球面上のvon Mises-Fisher (vMF)分布は正規化された球面ガウス関数で、照明近似やpath guidingなどレンダリングでしばしば使われている。しかし、このvMF分布を数式通りに実装すると浮動小数点の誤差が極めて大きくなってしまうことがある。またvMF分布のサンプリングについても、現在広く使用されている実装[Jakob 2012]ではvMFが極めて低周波の場合や高周波の場合では数値的に不安定になってしまう。そこで我々は全周波数に対してより数値的に安定したvMF分布の実装を発表する。

[P311] Anime Hair Editing Using Orientation Map Guided Diffusion Model

○Tianyu Zhang (Japan Advanced Institute of Science and Technology), I-Chao Shen (The University of Tokyo), Haoran Xie (Japan Advanced Institute of Science and Technology, Waseda University)

概要
In anime character design, hair is not merely a decorative element but a crucial visual component used to convey the personality and emotions of a character
This paper proposes an anime hair editing method that modifies the hairstyle of a source image based on a reference image
We use an orientation map to extract structural features from the reference image as an intermediate representation, which guides the generation process of the subsequent diffusion model
Our results demonstrate the potential of diffusion models in the task of anime hair editing

[P312] ユーザスケッチによる制御可能な流体動画生成モデルの提案

金昊(北陸先端科学技術大学院大学), ○王征洋(北陸先端科学技術大学院大学), 謝浩然(北陸先端科学技術大学院大学/早稲田大学)

概要
非公開

[P313] メモリ認識型多条件生成モデルを用いた都市空間の進化予測

○杜 旭升 (北陸先端科学技術大学院大学), Chengyuan Li (Tianjin University), Zhen Xu (Tianjin University), 謝 浩然 (北陸先端科学技術大学院大学/早稲田大学)

概要
本研究では、都市空間の将来的な形態変化を高精度に予測するメモリ認識型多条件生成モデル(MMCN: Memory-aware Multi-Conditional generation Network)を提案する。提案手法は、建物密度、建築物高さ分布、交通ネットワーク、および歴史的空間構成といった複数の都市形態要因を統合的に考慮することで、複雑な都市発展過程をモデル化する。特に、マルチプロンプト意味統合モジュールと隣接領域の空間情報を活用するメモリシステムの導入により、局所的な空間連続性と長期的な時間的整合性の両立を実現した。多モーダル・多時系列都市データセットを用いた実証実験の結果、提案手法は予測精度および空間的連続性の観点から既存手法と比較して優位性を示すことを確認した。

[P314] 多重反射を伴うSmith Microfacet BSDFにおける偏光パストレーシングの高速化

○大羽英仁(早稲田大学), 谷田川達也(一橋大学), 森島繁生(早稲田大学)

概要
本研究では、多重反射を伴うSmith Microfacet BSDFの評価において、座標系の回転が偏光状態の計算に与える影響を調査する。偏光状態の記述法の一つであるStokesベクトルは、電場および磁場の振動を記述する局所座標系上で定義され、BSDFの評価時には、この座標系を物体表面の法線方向に応じて回転する必要がある。しかし、座標系の回転がBSDFの評価結果に与える影響が小さければ、回転の計算を省略することでMicrofacetにおける多重反射の計算を大幅に簡略化できる。本研究では、この事実を理論的に示し、さらに計算機実験を通じ、より少ない計算時間で回転を厳密に考慮した場合と同品質のレンダリング画像が得られることを明らかにした。

[P315] シーン毎の少数サンプルと領域マスク処理によるアニメ線画の自動着色手法の定量評価

○杉本 拓海(京都産業大学大学院),平井 重行(京都産業大学)

概要
アニメ制作の効率化を目的に領域情報に基づく線画の自動着色の手法を提案している。この手法では、自動着色を行う深層学習モデルをシーン毎に作成する。シーン内の少数サンプルから、輪郭線に基づくパッチサンプリングにより領域形状と色ラベルを明示的に学習する。推論時には、未学習の線画に対して同様にパッチサンプリングを行い、領域単位での色ラベルを推定する。同領域への複数の推論結果から多数決によってその領域の色ラベルを決定する。本発表ではこの手法について、多数のシーンに対して行った評価考察について述べる。

[P316] 頭部置換と体型適応に基づく3D Gaussianアバターの仮想試着

○Wang Zhaorong, 金森 由博, 遠藤 結城 (筑波大学)

概要
3D Gaussian Splattingに基づく人物アバターの仮想試着手法を提案する.従来はターゲット人物の3Dアバターに衣服を新たに着せるため,衣服と身体が貫通しやすい問題があった.本研究では,衣服を既にまとった高品質な3Dアバターを用意し,その頭部・体型・肌色をターゲット人物に置換することで試着を実現する.さらに,サイクル一貫性損失で追加学習した拡散モデルにより首の継ぎ目を自然に補正する.これにより衣服分離や貫通処理を行うことなく,元の衣服情報を保持したまま高品質な仮想試着を可能にする.

スポンサー企業

(c) Visual Computing 2025 実行委員会