2021-4-10 | 證券交易論文
1證券交易接口數(shù)據(jù)是指行情、訂單、成交、參考數(shù)據(jù)、盤后數(shù)據(jù)等的證券交易相關(guān)信息,它具有產(chǎn)生量大、對實(shí)時性傳輸要求高的特點(diǎn).為保證交易信息高可用、可審計,以及處理上的方便,諸如衛(wèi)星行情等的一些證券交易接口往往采用DBF、XML等格式的文件作為數(shù)據(jù)交換的格式.但這類文件的信息冗余度較高,影響了傳輸帶寬的有效利用率和傳輸速度.此外,根據(jù)不同的傳輸協(xié)議,接口文件往往需要分成分段來進(jìn)行傳輸,接收方必須收齊所有分段才能獲得所含的記錄信息,若有分段丟失則會引起整個文件的重傳,這不僅造成了帶寬的浪費(fèi),也影響了信息交換的速度.盡管可以通過使用ZIP等通用的壓縮工具對接口文件進(jìn)行壓縮來解決信息冗余度高的缺陷,但文件分段拼接等待和丟失重傳影響傳輸速度的問題仍然無法解決.
FAST(FIXAdaptedforStreaming,適流FIX)[1]是一種面向消息數(shù)據(jù)流的二進(jìn)制編碼方法,它是2005年由全球主要交易所和金融企業(yè)聯(lián)盟組織FPL所提出的、針對證券交易業(yè)通行的金融信息消息協(xié)議FIX[2]的一套壓縮和傳輸方法.
FAST針對FIX消息的格式設(shè)計,在將FIX消息流序列化為字節(jié)流的過程中利用消息數(shù)據(jù)間的邏輯關(guān)系來對FIX消息所含的數(shù)據(jù)字段進(jìn)行編碼,可在FIX消息的基礎(chǔ)上獲得高達(dá)70-80%的壓縮率.FAST協(xié)議對消息的處理開銷很小,一般在數(shù)個微秒內(nèi)即可完成對一條消息的編、解碼.此外,F(xiàn)AST還具有簡單、易實(shí)現(xiàn)的優(yōu)點(diǎn),其最新的擴(kuò)展版本[3]FAST1.2于2009年被提出.
為解決前述現(xiàn)有文件類證券交易接口的問題,本文提出基于擴(kuò)展FAST的文件類證券交易數(shù)據(jù)高速交換方法-Fast-File.文件類證券交易接口數(shù)據(jù)一般由相同格式的多行記錄構(gòu)成,F(xiàn)astFile將接口文件中的每行記錄映射為一條消息,使用FAST對每條記錄所含的字段逐一進(jìn)行編解碼,這樣可通過利用記錄之間數(shù)據(jù)的邏輯聯(lián)系來降低數(shù)據(jù)冗余度.由于Fast-File的編碼粒度是基于一條記錄的,因此即便只是收到編碼文件的分段,也可對其進(jìn)行FAST的解碼,從而恢復(fù)出所含部分的記錄,這可使已收到分段的記錄能被快速地傳輸.本文設(shè)計并實(shí)現(xiàn)了擴(kuò)展FAST和FastFile方法,通過實(shí)驗(yàn)與多種常用的接口文件格式進(jìn)行了測試比較,并與幾種通用的壓縮工具進(jìn)行了壓縮率比較.實(shí)驗(yàn)結(jié)果表明FastFile除按照每行記錄為單位進(jìn)行編解碼,可降低重傳外,可大大降低現(xiàn)有文件接口的數(shù)據(jù)大小:比DBF小約70%、比XML小95%.即使與通用的壓縮算法相比,F(xiàn)astFile在數(shù)據(jù)壓縮率上也相當(dāng)接近,如果FastFile疊加使用通用壓縮方法則可以達(dá)到更高的壓縮率.實(shí)驗(yàn)結(jié)果驗(yàn)證了FastFile方法的可行性與有效性.
2證券交易接口系統(tǒng)及接口數(shù)據(jù)
證券交易接口系統(tǒng)主要負(fù)責(zé)通過衛(wèi)星和地面網(wǎng)絡(luò)等各種通信介質(zhì)在電子交易主機(jī),市場參與者、登記結(jié)算單位、外部交易所等外部系統(tǒng),以及監(jiān)察、行情分發(fā)等周邊系統(tǒng)之間進(jìn)行證券交易服務(wù)過程中交易相關(guān)信息(也即接口數(shù)據(jù))的交換.
對于證券交易所這種集中化的交易方式,電子化交易的發(fā)生時間集中、數(shù)據(jù)密集,在每一交易日內(nèi)交易所往往能產(chǎn)生數(shù)十吉字節(jié)的大量接口數(shù)據(jù).據(jù)估計,全球股票和期權(quán)市場日均產(chǎn)生的消息量將從2007年的七十多億條猛增至2010年的一千兩百多億條[4].考慮到這些數(shù)據(jù)將被進(jìn)一步分發(fā)到成百上千的內(nèi)部和外部用戶,帶寬占用的總量十分地龐大.
眾所周知,證券交易接口數(shù)據(jù)的交換與一般信息通信系統(tǒng)的信息交換不同,對速度具有極高的要求.近年來,國際、國內(nèi)資本市場獲得高速發(fā)展,資本流動性急劇增大,隨之帶來與日俱增的交易量、高頻交易的大量使用,都使得降低交易延遲的需求凸現(xiàn)出來.事實(shí)上,交易指令延遲時間及運(yùn)行性能的問題已成為各證券交易所目前最大的技術(shù)挑戰(zhàn)[5].為此,全球交易所紛紛采取措施降低交易延遲.其中,納斯達(dá)克OMX在2009年以250微秒的交易延遲成為世界上最快的交易所.
由于市場發(fā)展水平和技術(shù)應(yīng)用環(huán)境不同,各交易所采用了不同的接口實(shí)現(xiàn)方式,這包括:文件接口、數(shù)據(jù)庫接口、API程序接口、消息協(xié)議接口等.典型的證券交易接口包括開放協(xié)議FIX、Euronext的MMTP、Xetra的VALUES、納斯達(dá)克的CTCI、NWII、以及QIX等[6].其中,為保證接口數(shù)據(jù)的高可用、和/或業(yè)務(wù)過程的可審計,某些證券交易接口數(shù)據(jù)往往需要以文件的形式"落地"到外存中進(jìn)行可持久性存儲后再進(jìn)行發(fā)送.同時,為處理上的方便,一般采用TXT、DBF、XML等標(biāo)準(zhǔn)格式的文件來進(jìn)行存儲.以我國的上海證券交易所和深圳證券交易所為例,各自公開的數(shù)十種市場參與者接口均使用了基于數(shù)據(jù)庫文件的DBF接口.
然而,DBF、XML、文本等文件格式本身沒有考慮對于存儲空間的節(jié)省,如果若按照這類格式來表示數(shù)據(jù),信息的冗余度比較高,在傳輸時這會導(dǎo)致帶寬的有效利用率不高,從而造成浪費(fèi),這對于我國帶寬資源受限且發(fā)展欠均衡的證券市場網(wǎng)絡(luò)技術(shù)條件來說尤為不佳.
其次,在證券交易接口數(shù)據(jù)傳輸?shù)倪^程中,由于傳輸協(xié)議的限制,接口文件往往會被分割成多個分段進(jìn)行傳輸.譬如在基于UDP傳輸協(xié)議的網(wǎng)絡(luò)條件下,往往采用64KB大小來分段文件,在因特網(wǎng)上可能按4k、8k等較小的粒度來進(jìn)行文件分段,而在局域網(wǎng)上則可能以更大的尺寸來進(jìn)行分段.但是,按照現(xiàn)有的接口文件的數(shù)據(jù)交換模式,接收方必須要等到收齊所有文件分段之后,才能進(jìn)行拼裝和驗(yàn)證,從而獲得所含的記錄信息,這首先會引起等待的時間開銷.其次,如果在傳輸中文件分段丟失,則依據(jù)具體實(shí)現(xiàn),會引起對丟失分段甚至所有分段的重傳,由這種重傳所造成的延遲則可能更大,進(jìn)一步加重了文件分段帶來的延遲問題.
對現(xiàn)有方法冗余度高的一種可能的改進(jìn)方法如圖2.該方法借助ZIP、RAR、ARJ等無損的通用壓縮工具來進(jìn)行文件壓縮,降低文件接口數(shù)據(jù)冗余度,但這仍然無法解決由文件分段傳輸所帶來的延遲問題.
3基于擴(kuò)展FAST的文件接口數(shù)據(jù)交換方法
FAST是FPL在1995年提出的、針對FIX消息流的一種壓縮和傳輸方法.FIX消息流消息一般由消息頭、消息體和消息尾三部分組成,其中每部分由"tag=value"加分隔符的基本字段格式組成,其中消息尾為兩個字節(jié)的驗(yàn)證碼.FAST針對FIX消息,在將FIX消息流序列化為字節(jié)流的過程中,通過"字段編碼"和"傳輸編碼"的處理來利用消息數(shù)據(jù)間的邏輯關(guān)系,將字段數(shù)據(jù)編碼為二進(jìn)制字節(jié)流,通過這樣的處理可以大大降低字段所含數(shù)據(jù)的冗余度.譬如對于序號類別的字段來說,可以使用"遞增"的規(guī)律來總結(jié)字段數(shù)據(jù)的邏輯聯(lián)系,這樣就無需在傳輸每條消息時都對該字段數(shù)據(jù)內(nèi)容進(jìn)行發(fā)送.