PBOC/EMV之TLV編碼與解碼
文章出處:http://botanicstilllife.com 作者: 人氣: 發(fā)表時(shí)間:2012年03月15日
幾乎所有的需要在卡片和終端之間傳送的數(shù)據(jù)都是TLV格式的. PBOC文檔里并沒有對TLV編碼細(xì)節(jié)做具體說明, 而EMV的手冊里雖有敘述,但并不詳細(xì). 我下面就要很詳細(xì)的分析TLV的編碼格式并給出相應(yīng)的TLV解碼的偽代碼.
TLV是tag, length和value的縮寫.一個(gè)基本的數(shù)據(jù)元就包括上面三個(gè)域. Tag唯一標(biāo)識(shí)該數(shù)據(jù)元, length是value域的長度. Value就是數(shù)據(jù)本身了. 舉個(gè)例子, 下面是一個(gè)tlv格式的AID(應(yīng)用標(biāo)識(shí)符)字節(jié)串”9F0607A0000000031010”, 其中9F06是tag, 07是長度, A0000000031010就是AID本身的值了.
對于程序編寫人員來說,我們關(guān)心的是,如果有類似上面這樣的一串TLV編碼的字節(jié)串從卡片傳過來, 怎么樣從中提取我們想要的數(shù)據(jù). 這就牽扯出TLV解碼的問題了.
其中BER-TLV編碼是ISO定義一種規(guī)范, 然后到了PBOC/EMV里被簡化了, 哪里被簡化了呢?舉一個(gè)例子, tag域在ISO里可以有多個(gè)字節(jié), 而PBOC/EMV里規(guī)定只用前兩個(gè)字節(jié). 我下面要講的TLV解碼就是基于PBOC/EMV的簡化版本.
首先看一下tag域是怎樣編碼的. Tag域占最多占兩個(gè)字節(jié). 編碼規(guī)則如下面兩幅圖
解釋一下這兩幅圖. 第一個(gè)圖是第一個(gè)字節(jié)的編碼規(guī)則. b8和b7兩位標(biāo)識(shí)tag所屬類別. 這個(gè)可以暫時(shí)不用理. b6決定當(dāng)前的TLV數(shù)據(jù)是一個(gè)單一的數(shù)據(jù)和復(fù)合結(jié)構(gòu)的數(shù)據(jù). 復(fù)合的TLV是指value域里也包含一個(gè)或多個(gè)TLV, 類似嵌套的編碼格式. b5~b1如果全為1,則說明這個(gè)tag下面還有一個(gè)子字節(jié). 占兩個(gè)字節(jié), 否則tag占一個(gè)字節(jié).
第二幅圖是說明如果tag占用兩個(gè)字節(jié), 第二個(gè)字節(jié)的編碼格式. B8決定tag是否還有后緒的字節(jié)存在,因?yàn)榍懊嬲f過,PBOC/EMV里的tag最多占兩個(gè)字節(jié), 所以該位保持為0.
清楚了上面tag編碼格式,可很容易寫出tag域解碼的代碼了. 假設(shè),終端接收到一人字節(jié)串,這個(gè)字節(jié)串保存在tlvData的字節(jié)數(shù)組里, 偽代碼如下:
if ( (tlvData[i]&0x20) != 0x20)//單一結(jié)構(gòu)
{
if ( (tlvData[i]&0x1f) == 0x1f)//tag兩字節(jié)
{
tagIndex++;
//解析length域
//解析value域
}
else//tag單字節(jié)
{
//解析length域
//解析value域
}
}
else//復(fù)合結(jié)構(gòu)
{
//復(fù)合結(jié)構(gòu)可以考慮用遞歸的方法來實(shí)現(xiàn).
}
Length域的編碼比較簡單,最多有四個(gè)字節(jié), 如果第一個(gè)字節(jié)的最高位b8為0, b7~b1的值就是value域的長度. 如果b8為1, b7~b1的值指示了下面有幾個(gè)子字節(jié). 下面子字節(jié)的值就是value域的長度.
Value域的編碼格式要根據(jù)具體的value所表示的數(shù)據(jù)元決定. 比如AID是由RID+PIX構(gòu)成等. 這個(gè)不詳述. 有了上面的知識(shí),基本上可以寫一個(gè)TLV解碼器出來了.