/*
  Copyright (c) 2007-2009, The Musepack Development Team
  All rights reserved.

  Redistribution and use in source and binary forms, with or without
  modification, are permitted provided that the following conditions are
  met:

  * Redistributions of source code must retain the above copyright
  notice, this list of conditions and the following disclaimer.

  * Redistributions in binary form must reproduce the above
  copyright notice, this list of conditions and the following
  disclaimer in the documentation and/or other materials provided
  with the distribution.

  * Neither the name of the The Musepack Development Team nor the
  names of its contributors may be used to endorse or promote
  products derived from this software without specific prior
  written permission.

  THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
  "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
  LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
  A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
  OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
  DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
  THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
  (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
  OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*/

#define MAX_ENUM 32

MPC_API int mpc_bits_get_block(mpc_bits_reader * r, mpc_block * p_block);
mpc_int32_t mpc_bits_golomb_dec(mpc_bits_reader * r, const mpc_uint_t k);
MPC_API unsigned int mpc_bits_get_size(mpc_bits_reader * r, mpc_uint64_t * p_size);
mpc_uint32_t mpc_bits_log_dec(mpc_bits_reader * r, mpc_uint_t max);

extern const mpc_uint32_t Cnk     [MAX_ENUM / 2][MAX_ENUM];
extern const mpc_uint8_t  Cnk_len [MAX_ENUM / 2][MAX_ENUM];
extern const mpc_uint32_t Cnk_lost[MAX_ENUM / 2][MAX_ENUM];

// can read up to 31 bits
static mpc_inline mpc_uint32_t mpc_bits_read(mpc_bits_reader * r, const unsigned int nb_bits)
{
    mpc_uint32_t ret;

    r->buff -= (int)(r->count - nb_bits) >> 3;
    r->count = (r->count - nb_bits) & 0x07;

    ret = (r->buff[0] | (r->buff[-1] << 8)) >> r->count;
    if (nb_bits > (16 - r->count)) {
        ret |= (mpc_uint32_t)((r->buff[-2] << 16) | (r->buff[-3] << 24)) >> r->count;
        if (nb_bits > 24 && r->count != 0)
            ret |= r->buff[-4] << (32 - r->count);
    }

    return ret & ((1 << nb_bits) - 1);
}

#if defined(CPU_COLDFIRE)
/* rockbox: This is specific code to optimize demux performance on Coldfire
 * CPUs. Coldfire CPUs are very sensible to RAM accesses. As the bitstream
 * buffer does not fit into IRAM the read accesses to the uint8 buffer are very
 * expensive in terms of CPU cycles.
 * The following code uses two variables in IRAM. The variable last_code keeps
 * the 4-byte value of buf[0]<<16 | buf[1]<<8 | buf[2]. As long as buf[0] will 
 * read from the same address the following code will avoid re-reading of the 
 * buffers. If buf[0] did advance to the next uint8-entry since the last call
 * the following will only need to load 1 uint8-entry instead of 3. 
 */
static mpc_inline mpc_uint16_t get_code_from_buffer(mpc_bits_reader *r)
{
    /* Buffer advanced by 1 entry since last call */
    if (r->buff == r->buffered_addr + 1) {
        r->buffered_code = (r->buffered_code<<8) | r->buff[2];
        r->buffered_addr = r->buff;
    }
    /* Buffer must be fully re-read */
    else if (r->buff != r->buffered_addr) {
        r->buffered_code = (r->buff[0] << 16) | (r->buff[1] << 8) | r->buff[2];
        r->buffered_addr = r->buff;
    }

    return (mpc_uint16_t)((r->buffered_code >> r->count) & 0xFFFF);
}
#else
/* Use the decoder's default implementation. This is faster on non-Coldfire targets */
#define get_code_from_buffer(r) (mpc_uint16_t)((((r->buff[0] << 16) | (r->buff[1] << 8) | r->buff[2]) >> r->count) & 0xFFFF);
#endif

// basic huffman decoding routine
// works with maximum lengths up to 16
static mpc_inline mpc_int32_t mpc_bits_huff_dec(mpc_bits_reader * r, const mpc_huffman *Table)
{
    const mpc_uint16_t code = get_code_from_buffer(r);

    while (code < Table->Code) Table++;

    r->buff -= (int)(r->count - Table->Length) >> 3;
    r->count = (r->count - Table->Length) & 0x07;

    return Table->Value;
}

static mpc_inline mpc_int32_t mpc_bits_can_dec(mpc_bits_reader * r, const mpc_can_data *can)
{
    const mpc_uint16_t code = get_code_from_buffer(r);
    const mpc_huff_lut tmp  = can->lut[code >> (16 - LUT_DEPTH)];
    const mpc_huffman * Table;

    if (tmp.Length != 0) {
        r->buff -= (int)(r->count - tmp.Length) >> 3;
        r->count = (r->count - tmp.Length) & 0x07;
        return tmp.Value;
    }

    Table = can->table + (unsigned char)tmp.Value;
    while (code < Table->Code) Table++;

    r->buff -= (int)(r->count - Table->Length) >> 3;
    r->count = (r->count - Table->Length) & 0x07;

    return can->sym[(Table->Value - (code >> (16 - Table->Length))) & 0xFF] ;
}

// LUT-based huffman decoding routine
// works with maximum lengths up to 16
static mpc_inline mpc_int32_t mpc_bits_huff_lut(mpc_bits_reader * r, const mpc_lut_data *lut)
{
    const mpc_uint16_t code = get_code_from_buffer(r);
    const mpc_huff_lut tmp  = lut->lut[code >> (16 - LUT_DEPTH)];
    const mpc_huffman * Table;

    if (tmp.Length != 0) {
        r->buff -= (int)(r->count - tmp.Length) >> 3;
        r->count = (r->count - tmp.Length) & 0x07;
        return tmp.Value;
    }

    Table = lut->table + (unsigned char)tmp.Value;
    while (code < Table->Code) Table++;

    r->buff -= (int)(r->count - Table->Length) >> 3;
    r->count = (r->count - Table->Length) & 0x07;

    return Table->Value;
}

static mpc_inline mpc_uint32_t mpc_bits_enum_dec(mpc_bits_reader * r, mpc_uint_t k, mpc_uint_t n)
{
    mpc_uint32_t bits = 0;
    mpc_uint32_t code;
    const mpc_uint32_t * C = Cnk[k-1];

    code = mpc_bits_read(r, Cnk_len[k-1][n-1] - 1);

    if (code >= Cnk_lost[k-1][n-1])
        code = ((code << 1) | mpc_bits_read(r, 1)) - Cnk_lost[k-1][n-1];

    do {
        n--;
        if (code >= C[n]) {
            bits |= 1 << n;
            code -= C[n];
            C -= MAX_ENUM;
            k--;
        }
    } while(k > 0);

    return bits;
}
04'>104</a>
<a id='n105' href='#n105'>105</a>
<a id='n106' href='#n106'>106</a>
<a id='n107' href='#n107'>107</a>
<a id='n108' href='#n108'>108</a>
<a id='n109' href='#n109'>109</a>
<a id='n110' href='#n110'>110</a>
<a id='n111' href='#n111'>111</a>
<a id='n112' href='#n112'>112</a>
<a id='n113' href='#n113'>113</a>
<a id='n114' href='#n114'>114</a>
<a id='n115' href='#n115'>115</a>
<a id='n116' href='#n116'>116</a>
<a id='n117' href='#n117'>117</a>
<a id='n118' href='#n118'>118</a>
<a id='n119' href='#n119'>119</a>
<a id='n120' href='#n120'>120</a>
<a id='n121' href='#n121'>121</a>
<a id='n122' href='#n122'>122</a>
<a id='n123' href='#n123'>123</a>
<a id='n124' href='#n124'>124</a>
<a id='n125' href='#n125'>125</a>
<a id='n126' href='#n126'>126</a>
<a id='n127' href='#n127'>127</a>
<a id='n128' href='#n128'>128</a>
<a id='n129' href='#n129'>129</a>
<a id='n130' href='#n130'>130</a>
<a id='n131' href='#n131'>131</a>
<a id='n132' href='#n132'>132</a>
<a id='n133' href='#n133'>133</a>
<a id='n134' href='#n134'>134</a>
<a id='n135' href='#n135'>135</a>
<a id='n136' href='#n136'>136</a>
<a id='n137' href='#n137'>137</a>
<a id='n138' href='#n138'>138</a>
<a id='n139' href='#n139'>139</a>
<a id='n140' href='#n140'>140</a>
<a id='n141' href='#n141'>141</a>
<a id='n142' href='#n142'>142</a>
<a id='n143' href='#n143'>143</a>
<a id='n144' href='#n144'>144</a>
<a id='n145' href='#n145'>145</a>
<a id='n146' href='#n146'>146</a>
<a id='n147' href='#n147'>147</a>
<a id='n148' href='#n148'>148</a>
<a id='n149' href='#n149'>149</a>
<a id='n150' href='#n150'>150</a>
<a id='n151' href='#n151'>151</a>
<a id='n152' href='#n152'>152</a>
<a id='n153' href='#n153'>153</a>
<a id='n154' href='#n154'>154</a>
<a id='n155' href='#n155'>155</a>
<a id='n156' href='#n156'>156</a>
<a id='n157' href='#n157'>157</a>
<a id='n158' href='#n158'>158</a>
<a id='n159' href='#n159'>159</a>
<a id='n160' href='#n160'>160</a>
<a id='n161' href='#n161'>161</a>
<a id='n162' href='#n162'>162</a>
<a id='n163' href='#n163'>163</a>
<a id='n164' href='#n164'>164</a>
<a id='n165' href='#n165'>165</a>
<a id='n166' href='#n166'>166</a>
<a id='n167' href='#n167'>167</a>
<a id='n168' href='#n168'>168</a>
<a id='n169' href='#n169'>169</a>
<a id='n170' href='#n170'>170</a>
<a id='n171' href='#n171'>171</a>
<a id='n172' href='#n172'>172</a>
<a id='n173' href='#n173'>173</a>
<a id='n174' href='#n174'>174</a>
<a id='n175' href='#n175'>175</a>
<a id='n176' href='#n176'>176</a>
<a id='n177' href='#n177'>177</a>
<a id='n178' href='#n178'>178</a>
<a id='n179' href='#n179'>179</a>
<a id='n180' href='#n180'>180</a>
<a id='n181' href='#n181'>181</a>
<a id='n182' href='#n182'>182</a>
<a id='n183' href='#n183'>183</a>
<a id='n184' href='#n184'>184</a>
<a id='n185' href='#n185'>185</a>
<a id='n186' href='#n186'>186</a>
<a id='n187' href='#n187'>187</a>
<a id='n188' href='#n188'>188</a>
<a id='n189' href='#n189'>189</a>
<a id='n190' href='#n190'>190</a>
<a id='n191' href='#n191'>191</a>
<a id='n192' href='#n192'>192</a>
<a id='n193' href='#n193'>193</a>
<a id='n194' href='#n194'>194</a>
<a id='n195' href='#n195'>195</a>
<a id='n196' href='#n196'>196</a>
<a id='n197' href='#n197'>197</a>
<a id='n198' href='#n198'>198</a>
<a id='n199' href='#n199'>199</a>
<a id='n200' href='#n200'>200</a>
<a id='n201' href='#n201'>201</a>
<a id='n202' href='#n202'>202</a>
<a id='n203' href='#n203'>203</a>
<a id='n204' href='#n204'>204</a>
<a id='n205' href='#n205'>205</a>
<a id='n206' href='#n206'>206</a>
<a id='n207' href='#n207'>207</a>
<a id='n208' href='#n208'>208</a>
<a id='n209' href='#n209'>209</a>
<a id='n210' href='#n210'>210</a>
<a id='n211' href='#n211'>211</a>
<a id='n212' href='#n212'>212</a>
<a id='n213' href='#n213'>213</a>
<a id='n214' href='#n214'>214</a>
<a id='n215' href='#n215'>215</a>
<a id='n216' href='#n216'>216</a>
<a id='n217' href='#n217'>217</a>
<a id='n218' href='#n218'>218</a>
<a id='n219' href='#n219'>219</a>
<a id='n220' href='#n220'>220</a>
<a id='n221' href='#n221'>221</a>
<a id='n222' href='#n222'>222</a>
<a id='n223' href='#n223'>223</a>
<a id='n224' href='#n224'>224</a>
<a id='n225' href='#n225'>225</a>
<a id='n226' href='#n226'>226</a>
<a id='n227' href='#n227'>227</a>
<a id='n228' href='#n228'>228</a>
<a id='n229' href='#n229'>229</a>
<a id='n230' href='#n230'>230</a>
<a id='n231' href='#n231'>231</a>
<a id='n232' href='#n232'>232</a>
<a id='n233' href='#n233'>233</a>
<a id='n234' href='#n234'>234</a>
<a id='n235' href='#n235'>235</a>
<a id='n236' href='#n236'>236</a>
<a id='n237' href='#n237'>237</a>
<a id='n238' href='#n238'>238</a>
<a id='n239' href='#n239'>239</a>
<a id='n240' href='#n240'>240</a>
<a id='n241' href='#n241'>241</a>
<a id='n242' href='#n242'>242</a>
<a id='n243' href='#n243'>243</a>
<a id='n244' href='#n244'>244</a>
<a id='n245' href='#n245'>245</a>
<a id='n246' href='#n246'>246</a>
<a id='n247' href='#n247'>247</a>
<a id='n248' href='#n248'>248</a>
<a id='n249' href='#n249'>249</a>
<a id='n250' href='#n250'>250</a>
<a id='n251' href='#n251'>251</a>
<a id='n252' href='#n252'>252</a>
<a id='n253' href='#n253'>253</a>
<a id='n254' href='#n254'>254</a>
<a id='n255' href='#n255'>255</a>
<a id='n256' href='#n256'>256</a>
<a id='n257' href='#n257'>257</a>
<a id='n258' href='#n258'>258</a>
<a id='n259' href='#n259'>259</a>
<a id='n260' href='#n260'>260</a>
<a id='n261' href='#n261'>261</a>
<a id='n262' href='#n262'>262</a>
<a id='n263' href='#n263'>263</a>
<a id='n264' href='#n264'>264</a>
<a id='n265' href='#n265'>265</a>
<a id='n266' href='#n266'>266</a>
<a id='n267' href='#n267'>267</a>
<a id='n268' href='#n268'>268</a>
<a id='n269' href='#n269'>269</a>
<a id='n270' href='#n270'>270</a>
<a id='n271' href='#n271'>271</a>
<a id='n272' href='#n272'>272</a>
<a id='n273' href='#n273'>273</a>
<a id='n274' href='#n274'>274</a>
<a id='n275' href='#n275'>275</a>
<a id='n276' href='#n276'>276</a>
<a id='n277' href='#n277'>277</a>
<a id='n278' href='#n278'>278</a>
<a id='n279' href='#n279'>279</a>
<a id='n280' href='#n280'>280</a>
<a id='n281' href='#n281'>281</a>
<a id='n282' href='#n282'>282</a>
<a id='n283' href='#n283'>283</a>
<a id='n284' href='#n284'>284</a>
<a id='n285' href='#n285'>285</a>
<a id='n286' href='#n286'>286</a>
<a id='n287' href='#n287'>287</a>
<a id='n288' href='#n288'>288</a>
<a id='n289' href='#n289'>289</a>
<a id='n290' href='#n290'>290</a>
<a id='n291' href='#n291'>291</a>
<a id='n292' href='#n292'>292</a>
<a id='n293' href='#n293'>293</a>
<a id='n294' href='#n294'>294</a>
<a id='n295' href='#n295'>295</a>
<a id='n296' href='#n296'>296</a>
<a id='n297' href='#n297'>297</a>
<a id='n298' href='#n298'>298</a>
<a id='n299' href='#n299'>299</a>
<a id='n300' href='#n300'>300</a>
<a id='n301' href='#n301'>301</a>
<a id='n302' href='#n302'>302</a>
<a id='n303' href='#n303'>303</a>
<a id='n304' href='#n304'>304</a>
<a id='n305' href='#n305'>305</a>
<a id='n306' href='#n306'>306</a>
<a id='n307' href='#n307'>307</a>
<a id='n308' href='#n308'>308</a>
<a id='n309' href='#n309'>309</a>
<a id='n310' href='#n310'>310</a>
<a id='n311' href='#n311'>311</a>
<a id='n312' href='#n312'>312</a>
<a id='n313' href='#n313'>313</a>
<a id='n314' href='#n314'>314</a>
<a id='n315' href='#n315'>315</a>
<a id='n316' href='#n316'>316</a>
<a id='n317' href='#n317'>317</a>
<a id='n318' href='#n318'>318</a>
<a id='n319' href='#n319'>319</a>
<a id='n320' href='#n320'>320</a>
<a id='n321' href='#n321'>321</a>
<a id='n322' href='#n322'>322</a>
<a id='n323' href='#n323'>323</a>
<a id='n324' href='#n324'>324</a>
<a id='n325' href='#n325'>325</a>
<a id='n326' href='#n326'>326</a>
<a id='n327' href='#n327'>327</a>
<a id='n328' href='#n328'>328</a>
<a id='n329' href='#n329'>329</a>
<a id='n330' href='#n330'>330</a>
<a id='n331' href='#n331'>331</a>
<a id='n332' href='#n332'>332</a>
<a id='n333' href='#n333'>333</a>
<a id='n334' href='#n334'>334</a>
<a id='n335' href='#n335'>335</a>
<a id='n336' href='#n336'>336</a>
<a id='n337' href='#n337'>337</a>
<a id='n338' href='#n338'>338</a>
<a id='n339' href='#n339'>339</a>
<a id='n340' href='#n340'>340</a>
<a id='n341' href='#n341'>341</a>
<a id='n342' href='#n342'>342</a>
<a id='n343' href='#n343'>343</a>
<a id='n344' href='#n344'>344</a>
<a id='n345' href='#n345'>345</a>
<a id='n346' href='#n346'>346</a>
<a id='n347' href='#n347'>347</a>
<a id='n348' href='#n348'>348</a>
<a id='n349' href='#n349'>349</a>
<a id='n350' href='#n350'>350</a>
<a id='n351' href='#n351'>351</a>
<a id='n352' href='#n352'>352</a>
<a id='n353' href='#n353'>353</a>
<a id='n354' href='#n354'>354</a>
<a id='n355' href='#n355'>355</a>
<a id='n356' href='#n356'>356</a>
<a id='n357' href='#n357'>357</a>
<a id='n358' href='#n358'>358</a>
<a id='n359' href='#n359'>359</a>
<a id='n360' href='#n360'>360</a>
<a id='n361' href='#n361'>361</a>
<a id='n362' href='#n362'>362</a>
<a id='n363' href='#n363'>363</a>
<a id='n364' href='#n364'>364</a>
<a id='n365' href='#n365'>365</a>
<a id='n366' href='#n366'>366</a>
<a id='n367' href='#n367'>367</a>
<a id='n368' href='#n368'>368</a>
<a id='n369' href='#n369'>369</a>
<a id='n370' href='#n370'>370</a>
<a id='n371' href='#n371'>371</a>
<a id='n372' href='#n372'>372</a>
<a id='n373' href='#n373'>373</a>
<a id='n374' href='#n374'>374</a>
<a id='n375' href='#n375'>375</a>
<a id='n376' href='#n376'>376</a>
<a id='n377' href='#n377'>377</a>
<a id='n378' href='#n378'>378</a>
<a id='n379' href='#n379'>379</a>
<a id='n380' href='#n380'>380</a>
<a id='n381' href='#n381'>381</a>
<a id='n382' href='#n382'>382</a>
<a id='n383' href='#n383'>383</a>
<a id='n384' href='#n384'>384</a>
<a id='n385' href='#n385'>385</a>
<a id='n386' href='#n386'>386</a>
<a id='n387' href='#n387'>387</a>
<a id='n388' href='#n388'>388</a>
<a id='n389' href='#n389'>389</a>
<a id='n390' href='#n390'>390</a>
<a id='n391' href='#n391'>391</a>
<a id='n392' href='#n392'>392</a>
<a id='n393' href='#n393'>393</a>
<a id='n394' href='#n394'>394</a>
<a id='n395' href='#n395'>395</a>
<a id='n396' href='#n396'>396</a>
<a id='n397' href='#n397'>397</a>
<a id='n398' href='#n398'>398</a>
<a id='n399' href='#n399'>399</a>
<a id='n400' href='#n400'>400</a>
<a id='n401' href='#n401'>401</a>
<a id='n402' href='#n402'>402</a>
<a id='n403' href='#n403'>403</a>
<a id='n404' href='#n404'>404</a>
<a id='n405' href='#n405'>405</a>
<a id='n406' href='#n406'>406</a>
<a id='n407' href='#n407'>407</a>
<a id='n408' href='#n408'>408</a>
<a id='n409' href='#n409'>409</a>
<a id='n410' href='#n410'>410</a>
<a id='n411' href='#n411'>411</a>
<a id='n412' href='#n412'>412</a>
<a id='n413' href='#n413'>413</a>
<a id='n414' href='#n414'>414</a>
<a id='n415' href='#n415'>415</a>
<a id='n416' href='#n416'>416</a>
<a id='n417' href='#n417'>417</a>
<a id='n418' href='#n418'>418</a>
<a id='n419' href='#n419'>419</a>
<a id='n420' href='#n420'>420</a>
<a id='n421' href='#n421'>421</a>
<a id='n422' href='#n422'>422</a>
<a id='n423' href='#n423'>423</a>
<a id='n424' href='#n424'>424</a>
<a id='n425' href='#n425'>425</a>
<a id='n426' href='#n426'>426</a>
<a id='n427' href='#n427'>427</a>
<a id='n428' href='#n428'>428</a>
<a id='n429' href='#n429'>429</a>
<a id='n430' href='#n430'>430</a>
<a id='n431' href='#n431'>431</a>
<a id='n432' href='#n432'>432</a>
<a id='n433' href='#n433'>433</a>
<a id='n434' href='#n434'>434</a>
<a id='n435' href='#n435'>435</a>
<a id='n436' href='#n436'>436</a>
<a id='n437' href='#n437'>437</a>
<a id='n438' href='#n438'>438</a>
<a id='n439' href='#n439'>439</a>
<a id='n440' href='#n440'>440</a>
<a id='n441' href='#n441'>441</a>
<a id='n442' href='#n442'>442</a>
</pre></td>
<td class='lines'><pre><code><span class="hl com">/***************************************************************************</span>
<span class="hl com"> *             __________               __   ___.</span>
<span class="hl com"> *   Open      \______   \ ____   ____ |  | _\_ |__   _______  ___</span>
<span class="hl com"> *   Source     |       _//  _ \_/ ___\|  |/ /| __ \ /  _ \  \/  /</span>
<span class="hl com"> *   Jukebox    |    |   (  &lt;_&gt; )  \___|    &lt; | \_\ (  &lt;_&gt; &gt; &lt;  &lt;</span>
<span class="hl com"> *   Firmware   |____|_  /\____/ \___  &gt;__|_ \|___  /\____/__/\_ \</span>
<span class="hl com"> *                     \/            \/     \/    \/            \/</span>
<span class="hl com"> * $Id$</span>
<span class="hl com"> *</span>
<span class="hl com"> * Copyright (C) 2007 by Michael Sevakis</span>
<span class="hl com"> *</span>
<span class="hl com"> * This program is free software; you can redistribute it and/or</span>
<span class="hl com"> * modify it under the terms of the GNU General Public License</span>
<span class="hl com"> * as published by the Free Software Foundation; either version 2</span>
<span class="hl com"> * of the License, or (at your option) any later version.</span>
<span class="hl com"> *</span>
<span class="hl com"> * This software is distributed on an &quot;AS IS&quot; basis, WITHOUT WARRANTY OF ANY</span>
<span class="hl com"> * KIND, either express or implied.</span>
<span class="hl com"> *</span>
<span class="hl com"> ****************************************************************************/</span>

    <span class="hl ppc">.global     mpeg2_idct_copy</span>
    <span class="hl ppc">.type       mpeg2_idct_copy, %function</span>
    <span class="hl ppc">.global     mpeg2_idct_add</span>
    <span class="hl ppc">.type       mpeg2_idct_add, %function</span>


<span class="hl com">/* Custom calling convention:</span>
<span class="hl com"> * r0 contains block pointer and is non-volatile</span>
<span class="hl com"> * all non-volatile c context saved and restored on its behalf</span>
<span class="hl com"> */</span>
<span class="hl ppc">.idct:</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r12</span><span class="hl opt">,</span> <span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#128</span>
<span class="hl num">1</span><span class="hl opt">:</span>
    ldrsh  <span class="hl kwb">r1</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#0]           /* d0 */</span>
    ldrsh  <span class="hl kwb">r2</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#2]           /* d1 */</span>
    ldrsh  <span class="hl kwb">r3</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#4]           /* d2 */</span>
    ldrsh  <span class="hl kwb">r4</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#6]           /* d3 */</span>
    ldrsh  <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#8]           /* d0 */</span>
    ldrsh  <span class="hl kwb">r6</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#10]          /* d1 */</span>
    ldrsh  <span class="hl kwb">r7</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#12]          /* d2 */</span>
    ldrsh  <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#14]          /* d3 */</span>
    orrs   <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r3</span>
    orreqs <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r5</span>
    orreqs <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r7</span>
    cmpeq  <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl slc">#0</span>
    <span class="hl kwa">bne</span>    <span class="hl num">2</span>f
    mov    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> asl <span class="hl slc">#15</span>
    bic    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl slc">#0x8000</span>
    orr    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> lsr <span class="hl slc">#16</span>
    str    <span class="hl kwb">r1</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#4</span>
    str    <span class="hl kwb">r1</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#4</span>
    str    <span class="hl kwb">r1</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#4</span>
    str    <span class="hl kwb">r1</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#4</span>
    <span class="hl kwa">cmp</span>    <span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl kwb">r12</span>
    blo    <span class="hl num">1</span><span class="hl kwa">b</span>
    <span class="hl kwa">b</span>      <span class="hl num">3</span>f
<span class="hl num">2</span><span class="hl opt">:</span>
    mov    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> asl <span class="hl slc">#11        /* r1 = d0 = (block[0] &lt;&lt; 11) + 2048 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl slc">#2048</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> asl <span class="hl slc">#11    /* r1 = t0 = d0 + (block[2] &lt;&lt; 11) */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> asl <span class="hl slc">#12    /* r3 = t1 = d0 - (block[2] &lt;&lt; 11) */</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r4</span>             <span class="hl com">/* r9 = tmp = (d1+d3)*(1108/4) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#2</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#4</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#8</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#4    /* r2 = t2 = tmp + (d1*(1568/32)*8) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#2    /* r4 = t3 = tmp - (d3*(3784/8)*2) */</span>
    rsb    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#6</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#1</span>
    <span class="hl com">/* t2 &amp; t3 are 1/4 final value here */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#2     /* r1 = a0 = t0 + t2 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#3     /* r2 = a3 = t0 - t2 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#2     /* r3 = a1 = t1 + t3 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#3     /* r4 = a2 = t1 - t3 */</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r5</span>             <span class="hl com">/* r9 = tmp = 565*(d3 + d0) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#4</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#2</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asl <span class="hl slc">#4    /* r5 = t0 = tmp + (((2276/4)*d0)*4) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asl <span class="hl slc">#2</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asl <span class="hl slc">#2    /* r8 = t1 = tmp - (((3406/2)*d3)*2) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#4</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asl <span class="hl slc">#7</span>
    rsb    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asl <span class="hl slc">#1</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r7</span>             <span class="hl com">/* r9 = tmp = (2408/8)*(d1 + d2) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#2</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asl <span class="hl slc">#3    /* r7 = t2 = (tmp*8) - 799*d2 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asl <span class="hl slc">#4</span>
    rsb    <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    rsb    <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>

    <span class="hl kwa">sub</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asl <span class="hl slc">#4    /* r6 = t3 = (tmp*8) - 4017*d1 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asl <span class="hl slc">#6</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asl <span class="hl slc">#12</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r6</span>
    rsb    <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl com">/* t0 = r5, t1 = r8, t2 = r7, t3 = r6*/</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r7</span>             <span class="hl com">/* r9 = b0 = t0 + t2 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r6</span>            <span class="hl com">/* r10 = b3 = t1 + t3 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r7</span>             <span class="hl com">/* t0 -= t2 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r6</span>             <span class="hl com">/* t1 -= t3 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r8</span>             <span class="hl com">/* r6 = t0 + t1 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r8</span>             <span class="hl com">/* r7 = t0 - t1 */</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asr <span class="hl slc">#2    /* r6 = b1 = r6*(181/128) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> asr <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asr <span class="hl slc">#3</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asr <span class="hl slc">#2    /* r7 = b2 = r7*(181/128) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> asr <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asr <span class="hl slc">#3</span>
    <span class="hl com">/* r1 = a0, r3 = a1,   r4 = a2,   r2 = a3 */</span>
    <span class="hl com">/* r9 = b0, r6 = b1*2, r7 = b2*2, r10 = b3 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r9</span>             <span class="hl com">/* block[0] = (a0 + b0) &gt;&gt; 12 */</span>
    mov    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asr <span class="hl slc">#12</span>
    strh   <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#2</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asr <span class="hl slc">#1     /* block[1] = (a1 + b1) &gt;&gt; 12 */</span>
    mov    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asr <span class="hl slc">#12</span>
    strh   <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#2</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asr <span class="hl slc">#1     /* block[2] = (a2 + b2) &gt;&gt; 12 */</span>
    mov    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asr <span class="hl slc">#12</span>
    strh   <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#2</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r10</span>            <span class="hl com">/* block[3] = (a3 + b3) &gt;&gt; 12 */</span>
    mov    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asr <span class="hl slc">#12</span>
    strh   <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#2</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r10</span>            <span class="hl com">/* block[4] = (a3 - b3) &gt;&gt; 12 */</span>
    mov    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asr <span class="hl slc">#12</span>
    strh   <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#2</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asr <span class="hl slc">#1     /* block[5] = (a2 - b2) &gt;&gt; 12 */</span>
    mov    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asr <span class="hl slc">#12</span>
    strh   <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#2</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asr <span class="hl slc">#1     /* block[6] = (a1 - b1) &gt;&gt; 12 */</span>
    mov    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asr <span class="hl slc">#12</span>
    strh   <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#2</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r9</span>             <span class="hl com">/* block[7] = (a0 - b0) &gt;&gt; 12 */</span>
    mov    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asr <span class="hl slc">#12</span>
    strh   <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">],</span> <span class="hl slc">#2</span>
    <span class="hl kwa">cmp</span>    <span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl kwb">r12</span>
    blo    <span class="hl num">1</span><span class="hl kwa">b</span>
<span class="hl num">3</span><span class="hl opt">:</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#128</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r12</span><span class="hl opt">,</span> <span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#16</span>
<span class="hl num">4</span><span class="hl opt">:</span>
    ldrsh  <span class="hl kwb">r1</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#0*8]         /* d0 */</span>
    ldrsh  <span class="hl kwb">r2</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#2*8]         /* d1 */</span>
    ldrsh  <span class="hl kwb">r3</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#4*8]         /* d2 */</span>
    ldrsh  <span class="hl kwb">r4</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#6*8]         /* d3 */</span>
    ldrsh  <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#8*8]         /* d0 */</span>
    ldrsh  <span class="hl kwb">r6</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#10*8]        /* d1 */</span>
    ldrsh  <span class="hl kwb">r7</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#12*8]        /* d2 */</span>
    ldrsh  <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#14*8]        /* d3 */</span>

    mov    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> asl <span class="hl slc">#11        /* r1 = d0 = (block[0] &lt;&lt; 11) + 2048 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl slc">#65536</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> asl <span class="hl slc">#11    /* r1 = t0 = d0 + d2:(block[2] &lt;&lt; 11) */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> asl <span class="hl slc">#12    /* r3 = t1 = d0 - d2:(block[2] &lt;&lt; 11) */</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r4</span>             <span class="hl com">/* r9 = tmp = (d1+d3)*(1108/4) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#2</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#4</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#8</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#4    /* r2 = t2 = tmp + (d1*(1568/32)*8) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#2    /* r4 = t3 = tmp - (d3*(3784/8)*2) */</span>
    rsb    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#6</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#1</span>
    <span class="hl com">/* t2 &amp; t3 are 1/4 final value here */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#2     /* r1 = a0 = t0 + t2 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> asl <span class="hl slc">#3     /* r2 = a3 = t0 - t2 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#2     /* r3 = a1 = t1 + t3 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> asl <span class="hl slc">#3     /* r4 = a2 = t1 - t3 */</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r5</span>             <span class="hl com">/* r9 = tmp = 565*(d3 + d0) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#4</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#2</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asl <span class="hl slc">#4    /* r5 = t0 = tmp + (((2276/4)*d0)*4) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asl <span class="hl slc">#2</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asl <span class="hl slc">#2    /* r8 = t1 = tmp - (((3406/2)*d3)*2) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#4</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asl <span class="hl slc">#7</span>
    rsb    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asl <span class="hl slc">#1</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r7</span>             <span class="hl com">/* r9 = tmp = (2408/8)*(d1 + d2) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#2</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asl <span class="hl slc">#3    /* r7 = t2 = (tmp*8) - 799*d2 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asl <span class="hl slc">#4</span>
    rsb    <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> asl <span class="hl slc">#5</span>
    rsb    <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>

    <span class="hl kwa">sub</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asl <span class="hl slc">#4    /* r6 = t3 = (tmp*8) - 4017*d1 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asl <span class="hl slc">#6</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asl <span class="hl slc">#12</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r6</span>
    rsb    <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r9</span><span class="hl opt">,</span> asl <span class="hl slc">#3</span>
                                    <span class="hl com">/* t0=r5, t1=r8, t2=r7, t3=r6*/</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r9</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r7</span>             <span class="hl com">/* r9 = b0 = t0 + t2 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r10</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r6</span>            <span class="hl com">/* r10 = b3 = t1 + t3 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r7</span>             <span class="hl com">/* t0 -= t2 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r6</span>             <span class="hl com">/* t1 -= t3 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r8</span>             <span class="hl com">/* r6 = t0 + t1 */</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r8</span>             <span class="hl com">/* r7 = t0 - t1 */</span>

    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asr <span class="hl slc">#2    /* r6 = b1 = r5*(181/128) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> asr <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r6</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asr <span class="hl slc">#3</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asr <span class="hl slc">#2    /* r7 = b2 = r6*(181/128) */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> asr <span class="hl slc">#5</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r7</span><span class="hl opt">,</span> <span class="hl kwb">r11</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asr <span class="hl slc">#3</span>
    <span class="hl com">/* r1 = a0, r3 = a1,   r4 = a2,    r2 = a3 */</span>
    <span class="hl com">/* r9 = b0, r6 = b1*2, r7 = b2*2, r10 = b3 */</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r1</span><span class="hl opt">,</span> <span class="hl kwb">r9</span>             <span class="hl com">/* block[0] = (a0 + b0) &gt;&gt; 17 */</span>
    mov    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asr <span class="hl slc">#17</span>
    strh   <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#0*8]</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asr <span class="hl slc">#1     /* block[1] = (a1 + b1) &gt;&gt; 17 */</span>
    mov    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asr <span class="hl slc">#17</span>
    strh   <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#2*8]</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asr <span class="hl slc">#1     /* block[2] = (a2 + b2) &gt;&gt; 17 */</span>
    mov    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asr <span class="hl slc">#17</span>
    strh   <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#4*8]</span>
    <span class="hl kwa">add</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r10</span>            <span class="hl com">/* block[3] = (a3 + b3) &gt;&gt; 17 */</span>
    mov    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asr <span class="hl slc">#17</span>
    strh   <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#6*8]</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r2</span><span class="hl opt">,</span> <span class="hl kwb">r10</span>            <span class="hl com">/* block[4] = (a3 - b3) &gt;&gt; 17 */</span>
    mov    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asr <span class="hl slc">#17</span>
    strh   <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#8*8]</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r4</span><span class="hl opt">,</span> <span class="hl kwb">r7</span><span class="hl opt">,</span> asr <span class="hl slc">#1     /* block[5] = (a2 - b2) &gt;&gt; 17 */</span>
    mov    <span class="hl kwb">r8</span><span class="hl opt">,</span> <span class="hl kwb">r8</span><span class="hl opt">,</span> asr <span class="hl slc">#17</span>
    strh   <span class="hl kwb">r8</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#10*8]</span>
    <span class="hl kwa">sub</span>    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r3</span><span class="hl opt">,</span> <span class="hl kwb">r6</span><span class="hl opt">,</span> asr <span class="hl slc">#1     /* block[6] = (a1 - b1) &gt;&gt; 17 */</span>
    mov    <span class="hl kwb">r5</span><span class="hl opt">,</span> <span class="hl kwb">r5</span><span class="hl opt">,</span> asr <span class="hl slc">#17</span>
    strh   <span class="hl kwb">r5</span><span class="hl opt">, [</span><span class="hl kwb">r0</span><span class="hl opt">,</span> <span class="hl slc">#12*8]