CPU

GBAにはARM7TDMI(16.78MHz)と呼ばれる省電力に特徴的なCPUが使われています。開発元はイギリスのARM社です。基本的にアセンブラを知らなくてもゲームは作れるので、予備知識程度に知っておくのがいいと思います。偉そうなこといってますが、ぶっちゃけるとこんな項目を書いた自分も実はさっぱりなのです、わっはっは。(^^;

ARM7TDMI

ARMには様々な種類のチップが存在していて区別は名称(ARM7)以降のTDMIの1文字ごとです。ここで特に注意しておきたいのはTのThumb機能(命令セット)です。

TThumb機能
Dデバッグ機能
M乗算機能強化型
Iリアルタイムトレース機能

ARMステートとThumbステート

windowsでプログラムしている人ならご存知のとおり、PC互換機上ではx86命令セットの1種類で動いています。ところがARM7TDMIはARMThumbの2種類の命令セットが存在します。違いについては以下のとおりです。

命令セット命令サイズ特徴
ARM4バイトサイズが大きい分命令に幅がある。
Thumb2バイトサイズが小さい分命令が限られている。

このことについて、Dev'rs GBA Dev FAQsでは次のようなアドバイスをしています。

Should I use a C compiler that generates ARM or Thumb instructions?

Thumb code is able to provide up to 65% of the code size of ARM,
and 160% of the performance of ARM when accessing 16 bit memory.
(Source: ARM DDI 0029E) Since most code is usually run out of
ROM(which is 16 bit) it makes sense to use a Thumb compiler.
For the times when you need the extra performance of ARM,
you can always code these subroutines in ARM assembly language
and place them in internal WRAM.

メモリ領域(IWRAM, EWRAM, ROM)のサイズ、バス幅、アクセス時間との兼ね合いもあるので、基本的には以下の表を指針にさせてください。特にIWRAMはArmにするかThumbにするかで悩みます。ただ、どちらかというと容量の少なさにThumbを選択してしまうことが多い印象です。何か事情があってどうしてもという時はArmを選択します。

領域おすすめステート理由
IWRAMARM or Thumbサイズが少ない為
EWRAMThumbバス幅が16bitの為
ROMThumbバス幅が16bitの為

ステートの切り替えについて

C言語でソースコードを書く分には切り替えを意識する必要はなく、コンパイラがすべてやってくれています。ただ、問題はアセンブラやインラインアセンブラでの話ですが・・・勉強不足なので省略させて頂きます(爆。割り込みについては正直日記さんに詳しく書かれていましたので引用させていただきました。thumbで書くとハマるので注意してください。

割り込みハンドラがthumbで動かない訳

IRQ例外が発生すると現在の状態に関わらずARMステートに移行した後、BIOS
の0x00000018に飛ぶわけですよ。

んで、BIOSから割り込みハンドラへと飛ぶのですが、そのときにbx(ARM←→
THUMBステートの移行が出来る)ではなく ldr(ARM←→THUMBステートの移行
が出来ない)で飛んでいるんです。

実際はTHUMBコードで書かれているのに、CPUはARMステートのままなのでARM
コードとして解釈されるわけです。だから割り込みハンドラを-mthumbでコン
パイルするとうまく動かないわけ。

割り込み関数については必ずARMで書かなくてはいけません。Cのソースコードで指定したい場合はファイル名で決まります。

irq.arm.c
irq.arm.h
intr.arm.c
intr.arm.h

という様に、xxx.arm.cと書けばARMになります。このファイルの関数からthumbコードを呼び出した時はコンパイラがうまく切り替えてくれるので気にしなくて大丈夫です。詳しいコンパイルの記述については以下のファイルを参照してください。

C:\devkitPro\devkitARM\gba_rules
C:\devkitPro\devkitARM\base_rules

速さの基準

速さの基準にMIPSやベンチマークなどが存在します。とはいうものの、プログラマに必要なのは自分のコードが軽いか重いか、体感という大雑把な基準でいいと思っています。重ければアルゴリズムの選定をやりなおしたり、根本的に書き直します。数値的な基準としてはVCOUNTやタイマーのカウントを利用するとテストコードが作れます。他にもfpsを常時表示しておくのもいいかもしれません。

割り算、除算の罠

ARM7TDMIの命令セットには割り算、除算がないためlibgccを暗黙に呼び出しています。内部的に処理を行っているのは大変ありがたいのですけれど、コードはROM領域(0x08000000)に固定されています。つまりとんでもなく低速です。使わないことにはこしたことはないけれど、どうしても必要な場合はBIOS機能を使いましょう。以下に除算ベンチマークをしてみた比較結果を記載しました。

#include "lib/gba.h"

//---------------------------------------------------------------------------
void WaitForVsync(void)
{
	while (*(volatile u16*)0x4000006 >= 160) {};
	while (*(volatile u16*)0x4000006 <  160) {};
}
//---------------------------------------------------------------------------
void WaitForVCount(u32 c)
{
	while (*(volatile u16*)0x4000006 != 0) {};
}
//---------------------------------------------------------------------------
u32 GetVCount(void)
{
	return *(volatile u16*)0x4000006;
}
//---------------------------------------------------------------------------
#define LOOP	100

int main(void)
{
	volatile s32 i, r1, r2, c1, c2;
	volatile s32 m = 1234567;


	// libc --------------------------------
	c1 = 0;
	WaitForVCount(0);

	for(i=0; i<LOOP; i++)
	{
		r1 = m % 13;
	}
	c1 = GetVCount();

	// bios --------------------------------
	c2 = 0;
	WaitForVCount(0);

	for(i=0; i<LOOP; i++)
	{
		r2 = Mod(m, 13);
	}
	c2 = GetVCount();

	// result ------------------------------
	TRACE("result: %d %d\n", r1, r2);
	TRACE("libc: %d\n", c1);
	TRACE("bios: %d\n", c2);

	for(;;)
	{
		WaitForVsync();
	}
}

表からわかるとおり100回ループするとVcountで87!という驚異の数値になります。VBLANKが60~227内ということを考えたのなら、この数値は非常に重たいと言わざる負えません。とはいえ全面的にlibgccを使うのはやめようといっているのではなく、自分の作りたいものを想像して許容するかどうかのトレードオフを考えてほしいと思っています。カレンダーアプリなら別にいいかとか、シューティングゲームならやめようとか。

何気なく普通に書いたソースコードだったとしても、コンパイラは勝手にlibgccなどを入れてきます。make後に生成されたmapファイルを見て、意図しない関数が入っていないかチェックしてください。そもそも入れるのが嫌ならばコンパイルオプションで無効化しましょう。以下のように-nostdlibすると問答無用でエラー表示してくれるようになります。

LDFLAGS = -Map $(MAPFILE) -Wall -specs=gba.specs -nostartfiles
#LDFLAGS = -Map $(MAPFILE) -Wall -specs=gba.specs -nostartfiles -nostdlib

履歴


トップ   一覧 検索 最終更新   ヘルプ   最終更新のRSS