GBAにはARM7TDMI(16.78MHz)と呼ばれる省電力に特徴的なCPUが使われています。開発元はイギリスのARM社です。基本的にアセンブラを知らなくてもゲームは作れるので、予備知識程度に知っておくのがいいと思います。偉そうなこといってますがぶっちゃけるとこんな項目を書いた自分も実はさっぱりなのです、わっはっは。(^^;
ARMには様々な種類のチップが存在していて区別は名称(ARM7)以降のTDMIの1文字ごとの意味でしているようです。ここで特に注意しておきたいのはTのThumb機能(命令セット)です。
T | Thumb機能 |
D | デバッグ機能 |
M | 乗算機能強化型 |
I | リアルタイムトレース機能 |
windowsでプログラムしている人ならご存知のとおり、PC互換機上ではx86命令セットの1種類で動いています。ところがARM7TDMIはARMとThumbの2種類の命令セットが存在します。違いについては以下のとおりです。
命令セット | 命令サイズ | 特徴 |
ARM | 4バイト | サイズが大きい分命令に幅がある。 |
Thumb | 2バイト | サイズが小さい分命令が限られている。 |
このことについて、Dev'rs GBA Dev FAQsでは次のようなアドバイスをしています。
Should I use a C compiler that generates ARM or Thumb instructions? Thumb code is able to provide up to 65% of the code size of ARM, and 160% of the performance of ARM when accessing 16 bit memory. (Source: ARM DDI 0029E) Since most code is usually run out of ROM(which is 16 bit) it makes sense to use a Thumb compiler. For the times when you need the extra performance of ARM, you can always code these subroutines in ARM assembly language and place them in internal WRAM.
メモリ領域(IWRAM, EWRAM, ROM)のサイズ、バス幅、アクセス時間との兼ね合いもあるので基本的には以下のような表を指針にさせていただければと思います。
領域 | おすすめステート | 理由 |
IWRAM | ARM or Thumb | サイズが少ない為 |
EWRAM | Thumb | バス幅が16bitの為 |
ROM | Thumb | バス幅が16bitの為 |
IWRAMにArmかThumbかで悩みそうなところです。ただ容量の少なさにThumbを選択してしまうことが多い印象です。何か事情があってどうしてもという時はArmを選択します。
C言語でソースコードを書く分には切り替えを意識する必要はなく、コンパイラがすべてやってくれています。ただ、問題はアセンブラやインラインアセンブラでの話ですが・・・勉強不足なので省略させて頂きます(爆。割り込みについては正直日記さんに詳しく書かれていましたので引用させていただきました。thumbで書くとハマるので注意してください。
割り込みハンドラがthumbで動かない訳 IRQ例外が発生すると現在の状態に関わらずARMステートに移行した後、BIOS の0x00000018に飛ぶわけですよ。 んで、BIOSから割り込みハンドラへと飛ぶのですが、そのときにbx(ARM←→ THUMBステートの移行が出来る)ではなく ldr(ARM←→THUMBステートの移行 が出来ない)で飛んでいるんです。 実際はTHUMBコードで書かれているのに、CPUはARMステートのままなのでARM コードとして解釈されるわけです。だから割り込みハンドラを-mthumbでコン パイルするとうまく動かないわけ。
割り込み関数については必ずARMで書かなくてはいけません。Cのソースコードで指定したい場合はファイル名で決まります。
irq.arm.c irq.arm.h intr.arm.c intr.arm.h
という様に、xxx.arm.cと書けばARMになります。このファイルの関数からthumbコードを呼び出した時はコンパイラがうまく切り替えてくれるので気にしなくて大丈夫です。詳しいコンパイルの記述については以下のファイルを参照してください。
C:\devkitPro\devkitARM\gba_rules C:\devkitPro\devkitARM\base_rules
速さの基準にMIPSやベンチマークなどが存在します。とはいうものの、プログラマに必要なのは自分のコードが軽いか重いか、体感という大雑把な基準でいいと思っています。重ければアルゴリズムの選定をし直したり、根本的に書き直します。数値的な基準としてはVCOUNTやタイマーのカウントを利用すると簡単にテストコードが作れます。他にもfpsを常時表示しておくのもいいかもしれません。
ARM7TDMIの命令セットには割り算、除算がないためlibgccを暗黙に呼び出しています。内部的に処理を行っているのは大変ありがたいのですけれど、このコードはROM領域(0x08000000)に固定されています。つまりとんでもなく低速です。使わないことにはこしたことはないけれど、どうしても必要な場合はBIOS機能を使いましょう。以下に除算ベンチマークをしてみた比較結果です。
ループ回数 | 5 | 10 | 20 | 30 | 40 | 50 | 100 |
libgcc | 4 | 8 | 17 | 26 | 35 | 43 | 87 |
BIOS | 1 | 3 | 5 | 8 | 11 | 14 | 29 |
表からわかるとおり100回ループするとVcountで87回!という驚異の数値になります。VBLANKが60~227内ということを考えたのなら、この数値は非常に重たいと言わざる負えません。とはいえ全面的にlibgccを使うのはやめようといっているのではなく、自分の作りたいものを想像して許容するかどうかのトレードオフを考えてほしいと思っています。カレンダーアプリなら別にいいかとか、シューティングゲームならやめようとか。
#include "lib/gba.h" //--------------------------------------------------------------------------- void WaitForVsync(void) { while (*(volatile u16*)0x4000006 >= 160) {}; while (*(volatile u16*)0x4000006 < 160) {}; } //--------------------------------------------------------------------------- void WaitForVCount(u32 c) { while (*(volatile u16*)0x4000006 != 0) {}; } //--------------------------------------------------------------------------- u32 GetVCount(void) { return *(volatile u16*)0x4000006; } //--------------------------------------------------------------------------- #define LOOP 100 int main(void) { volatile s32 i, r1, r2, c1, c2; volatile s32 m = 1234567; // libc -------------------------------- c1 = 0; WaitForVCount(0); for(i=0; i<LOOP; i++) { r1 = m % 13; } c1 = GetVCount(); // bios -------------------------------- c2 = 0; WaitForVCount(0); for(i=0; i<LOOP; i++) { r2 = Mod(m, 13); } c2 = GetVCount(); // result ------------------------------ TRACE("result: %d %d\n", r1, r2); TRACE("libc: %d\n", c1); TRACE("bios: %d\n", c2); for(;;) { WaitForVsync(); } }
Archive member included to satisfy reference by file (symbol) c:/devkitpro/devkitarm/bin/../lib/gcc/arm-none-eabi/12.2.0\libgcc.a(_divsi3.o) obj/main.o (__aeabi_idivmod) c:/devkitpro/devkitarm/bin/../lib/gcc/arm-none-eabi/12.2.0\libgcc.a(_dvmd_tls.o) c:/devkitpro/devkitarm/bin/../lib/gcc/arm-none-eabi/12.2.0\libgcc.a(_divsi3.o) (__aeabi_idiv0) (中略) *(EXCLUDE_FILE(*.iwram*) .text*) .text.startup 0x080001f8 0xb8 obj/main.o 0x080001f8 main .text 0x080002b0 0x148 c:/devkitpro/devkitarm/bin/../lib/gcc/arm-none-eabi/12.2.0\libgcc.a(_divsi3.o) 0x080002b0 __divsi3 0x080002b0 __aeabi_idiv 0x080003d8 __aeabi_idivmod .text 0x080003f8 0x4 c:/devkitpro/devkitarm/bin/../lib/gcc/arm-none-eabi/12.2.0\libgcc.a(_dvmd_tls.o) 0x080003f8 __aeabi_idiv0 0x080003f8 __aeabi_ldiv0
何気なく普通に書いたソースコードだったとしても、コンパイラは勝手にlibgccなどを入れてきます。make後に生成されたmapファイルを見て、意図しない関数が入っていないかチェックしてください。そもそも入れるのが嫌ならばコンパイルオプションで無効化します。以下のように-nostdlibすると問答無用でエラー表示してくれるようになります。
LDFLAGS = -Map $(MAPFILE) -Wall -mthumb-interwork -specs=gba.specs -nostartfiles -nostdlib #LDFLAGS = -Map $(MAPFILE) -Wall -mthumb-interwork -specs=gba.specs -nostartfiles