Updated on 2026/04/17

写真a

 
TOMINAGA HIROBUMI
 
Organization
Undergraduate School School of Interdisciplinary Mathematical Sciences Assistant Professor (non-tenured)
Title
Assistant Professor (non-tenured)
External link

Research Interests

  • 並列ソフトウェア,GPU,数値計算

  • 数値計算

  • GPU

  • 並列ソフトウェア

Research Areas

  • Informatics / Computer systems

  • Informatics / High-performance computing  / 高性能計算

Education

  • Chiba Institute of Technology   Graduate School of Information and Computer Science

    2010.4 - 2018.3

      More details

    Country/Region: Japan

    researchmap

Research History

  • Meiji University   Assistant Professor (non-tenured)

    2024

      More details

  • Chiba University

    2022.11 - 2024.3

      More details

  • Chiba Institute of Technology

    2020.4 - 2022.10

      More details

Professional Memberships

Papers

  • NVIDIA Voltaアーキテクチャを用いた拡張ベクトル化LU分解法 Reviewed

    富永 浩文, 佐藤 滉斗, 中村 あすか, 前川 仁孝

    電気学会論文誌C(電子・情報・システム部門誌)   146 ( 3 )   239 - 245   2026.3

     More details

    Authorship:Lead author   Publishing type:Research paper (scientific journal)  

    researchmap

  • Speedup of SFM Using the Field of View by Reduction of the Number of Distance Calculations Between Agents Reviewed

    65 ( 1 )   15 - 22   2024.1

     More details

    Language:Japanese   Publishing type:Research paper (scientific journal)  

    DOI: 10.20729/00231725

    researchmap

  • Evaluation of EMVA using the instruction-level parallelism on TegraX1 Reviewed International journal

    Hirobumi Tominaga,Asuka Nakamura,Yoshitaka Maekawa

    2018 Sixth International Symposium on Computing and Networking Workshops (CANDARW)   2018.12

     More details

    Language:English   Publishing type:Research paper (scientific journal)  

    researchmap

  • Evaluation of Hierarchical Pincers Attack Search on Distributed Memory Systems Reviewed International journal

    Asuka Namamura,Hirobumi Tominaga,Yoshitaka Maekawa

    2018 Sixth International Symposium on Computing and Networking Workshops (CANDARW)   2018.12

     More details

    Language:English   Publishing type:Research paper (scientific journal)  

    researchmap

  • A Speedup Method for PDF/IHS by Reducing of Branching Nodes in Task Scheduling Problems Reviewed

    11 ( 2 )   17 - 26   2018.8

     More details

    Language:Japanese   Publishing type:Research paper (scientific journal)  

    CiNii Research

    researchmap

  • レジスタ最適化を用いたCUDAによる格子ボルツマン法の高速化手法 Reviewed

    富永, 浩文, 中村, あすか, 前川, 仁孝

    情報処理学会論文誌プログラミング(PRO)   11 ( 2 )   1 - 8   2018.6

     More details

    Language:Japanese   Publishing type:Research paper (scientific journal)  

    本論文では,CUDA(Compute Unifide Device Architecture)を用いた格子ボルツマン法(LBM:Lattice Boltzmann Method)を高速化するために,メモリアクセス遅延を削減する手法を提案する.格子ボルツマン法は,解析領域を格子に分割し離散化されたボルツマン方程式を解く手法である.ボルツマン方程式の計算は,周囲の格子点の情報を参照するため,メモリアクセスコストが高いメモリバウンドな計算である.このため,LBMのメモリアクセスコストを削減する手法の1つとしてテンポラルブロッキングが用いられている.CUDAによるテンポラルブロッキングを用いた格子ボルツマン法は,ブロックに分割した領域をスレッドブロックに割り当て時間発展方程式を計算する.本計算は,メモリアクセスのコストを抑えるが,シェアードメモリにデータを格納することで,シェアードメモリに対する同期処理やレイテンシによるアクセスコストが処理の大部分を占める.そこで,本論文では,メモリアクセスコストが低いレジスタを用いてテンポラルブロッキングを行うことで処理を高速化する手法を提案する.提案手法は,テンポラルブロッキングにおける複数時間ステップの計算をレジスタ上に保持して行うことで処理を高速化する.

    researchmap

  • CUDA における JDS 形式疎行列ベクトル積に対するダイナミックパラレリズムの評価 Reviewed

    長坂 一生, 富永 浩文, 中村 あすか, 前川 仁孝

    xSIG (cross-disciplinary workshop on computing Systems, Infrastructures, and programming )   2018.5

     More details

  • タスクスケジューリング問題におけるレディ状態の割当て削減によるPDF/IHSの高速化 Reviewed

    中村, あすか, 富永, 浩文, 前川, 仁孝

    情報処理学会論文誌   58 ( 3 )   654 - 662   2017.3

     More details

    Language:Japanese   Publishing type:Research paper (scientific journal)  

    本論文は,タスクスケジューリング問題の厳密解法であるPDF/IHS(Parallel Depth First/Implicit Heuristic Search)の探索ノード数を削減するアルゴリズムを提案する.PDF/IHSは,階層的挟み撃ち探索を用いた分枝限定法の並列探索アルゴリズムであり,大規模なタスクスケジューリング問題を高速に解くためには探索ノード数の削減が必要となる.PDF/IHSの分枝操作は,スケジュールが未確定となる時刻に実行可能なタスクの処理またはレディ状態を割り当てる全組合せを部分問題として生成する.このため,不必要なレディ状態が割り当てられた部分問題が生成されることがある.そこで,本論文では,PDF/IHSの探索ノード数を削減するために,レディ状態を割り当てる部分問題のうち,最適解が得られないことが保障できる部分問題を枝刈りする.提案するアルゴリズムは,分枝操作で割り当てられたタスクの処理時間の情報から探索する必要のない部分問題を判定する.評価の結果,提案手法は,PDF/IHSに対して最大約96倍高速に求解できることを確認した.

    researchmap

  • CUDAによるランダムスパース方程式求解の命令レベル並列性を用いた高速化手法 Reviewed

    富永, 浩文, 前川, 仁孝

    情報処理学会論文誌プログラミング(PRO)   7 ( 1 )   10 - 17   2014.1

     More details

    Language:Japanese   Publishing type:Research paper (scientific journal)  

    本論文では,CUDA GPUにおいて実非対称(ランダムスパース)な構造を持つ方程式の求解を高速化するために,スタティックスケジューリングによって抽出した命令レベル並列性を用いてベクトル命令を生成するアルゴリズムを提案する.従来より,ランダムスパース方程式求解には直接法が用いられている.直接法によるランダムスパース方程式の求解は,零要素を含む演算を省くことで効率良く実行できる.よって,CUDA GPU上で演算の効率を高めるためには,スタティックスケジューリングを用いて零演算を含まない演算のみを抽出しベクトル化する.本手法は,方程式を求解する際に実行可能であるという組合せの情報のみを抽出することで,ベクトル化する.しかし,従来のように実行可能であるという組合せの情報のみからベクトル化するだけでは,高い効率で計算ができない.スケジューリングする際に,依存関係以外の情報も考慮することでCUDA GPUで演算の高速化が期待できる.そこで本論文では,すべての演算の依存関係を用いてスタティックスケジューリングを行うことで同時に実行可能な演算を抽出し,ベクトル化する.本手法によるスケジューリングでは,同時に実行可能な命令のうち,依存関係を多く持つ演算から優先的にベクトル化することでCUDA GPUによる効率的な演算を可能にする.

    researchmap

  • A Reduction Algorithm of Overlapping Search Space for Hierarchical Pincers Attack Search Reviewed

    ( 2011 )   348 - 355   2011.5

     More details

    Language:Japanese   Publishing type:Research paper (scientific journal)  

    researchmap

▼display all

Presentations

  • マルチGPU上での粒子法陽解法におけるバケット順データレイアウト

    情報処理学会第88回全国大会  2026.3 

     More details

  • 探索深度を用いたSNDAとWPNSの切り替えによるdf-pnの高速化

    情報処理学会第88回全国大会  2026.3 

     More details

  • ブロック化適用補間処理によるBilinear補間を併用したLanczos補間の高速化

    情報処理学会第88回全国大会  2026.3 

     More details

  • シーム探索削減を用いた並列マルチシームカービングの高速化

    情報処理学会第88回全国大会  2026.3 

     More details

  • GPU上での粒子法陽解法におけるバケット順データレイアウト

    情報処理学会第24回情報科学技術フォーラム  2025.9 

     More details

  • Parallelism Extraction Method for Solving Simultaneous Linear Equations for Circuit Analysis on the CUDA

    2025.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • 畳み込みニューラルネットワークとUchuu-UniverseMachineカタログを用いた銀河団質量とスケール半径の推定

    日本天文学会 2025年春季年会  2025.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • 粒子の影響半径を用いた影響範囲の近似精度向上による解像度可変型MPS法の近傍判定回数削減

    情報処理学会 第195回 ハイパフォーマンスコンピューティング発表研究会  2024.8 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • Jetson AGX Xarvierにおける拡張ベクトル化LU分解法の評価

    情報処理学会第22回情報科学技術フォーラム  2023.9 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • コード生成法を用いたLU分解法によるSPICE3の高速化に対する検討

    電気学会電子回路研究会  2023.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • 拡張ベクトル化LU分解法による回路方程式求解のためのCUDAカーネルの実装方式の評価

    電気学会電子回路研究会  2022.9 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • 人流シミュレーションにおける格子分割を用いた進行方向ベクトル計算の削減手法

    情報処理学会第85回全国大会  2022.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • Tesla V100を用いたTensorコアとCUDAコアの併用による行列積の高速化

    情報処理学会第20回情報科学技術フォーラム  2021.9 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • 視野を考慮した探索範囲削減による人流シミュレーションの高速化

    情報処理学会第20回情報科学技術フォーラム  2021.9 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • CUDAを用いたMPS法における疎行列格納形式動的選択による高速化

    情報処理学会第82回全国大会  2020.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • CUDAにおけるダイナミックパラレリズムを用いたJDS形式疎行列ベクトル積の評価

    情報処理学会第80回全国大会  2018.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • レジスタ最適化を用いたCUDAによる格子ボルツマン法の高速化手法

    情報処理学会第117回プログラミング研究会発表会  2018.1 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • タスクスケジューリング問題におけるDF/IHS 法の探索ノード数削減

    情報処理学会第110回プログラミング研究発表会  2016.8 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • タスクスケジューリング問題におけるDF/IHS 法のハッシュテーブルを用いた探索ノード数削減

    情報処理学会第78回全国大会  2016.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • GPU を用いた格子ボルツマン法のループ展開を利用した同期オーバヘッド削減による高速化

    情報処理学会第105回プログラミング研究発表会  2015.8 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • GPU を用いた格子ボルツマン法のループ展開を利用したメモリアクセスの局所性向上による高速化

    情報処理学会第77回全国大会  2015.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • CUDAによるランダムスパース方程式求解の命令レベル並列性を用いた高速化手法

    情報処理学会第95回プログラミング研究発表会  2013.8 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • 有限要素法による電磁場解析の透磁率を用いた演算回数削減手法

    情報処理学会第75回全国大会  2013.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

  • GPUのキャッシュヒット率向上によるDEMの高速化

    情報処理学会第74回全国大会  2012.3 

     More details

    Language:Japanese   Presentation type:Oral presentation (general)  

    researchmap

▼display all

Awards

  • 2014年度コンピュータ領域奨励賞

    2014.11   情報処理学会  

     More details

    Award type:Award from Japanese society, conference, symposium, etc.  Country/Region:Japan

    researchmap

Research Projects

  • 命令レベルの並列性とGPUを利用した電子回路シミュレーションSPICE3の高速化に関する研究

    2022.7 - 2023.3

      More details

    Authorship:Principal investigator 

    researchmap