附录 1. HTTP通信加密算法
当需要和 Spark 平台进行 HTTP 通信时,需要将原始的 Query String 转换为和请求时刻相关的 Hashed Query String 后再通过 GET 方法请求 Spark API。为了描述的方便,我们将 Query String 转换为 Hashed Query String 的算法称为 THQS 算法。在描述详细的算法流程之前,我们先介绍一下 Unix 时间戳的概念。Unix 时间戳,即该时间到 1970 年 1 月 1 日(UTC/GMT 的午夜)之间的秒数。 例如,北京时间 2010 年 12 月 9 日 15 点 23 分 12 秒的 Unix 时间戳为 1291879392。
THQS 算法
假设原来的QueryString 为q,通过以下 4 个步骤,即可得到最终用于通信的HashedQueryString:
(特别说明:QueryString 里面的value 值都需要进行URL Encode 之后,再进行传递,否则会Hash校验失败)
1. 对于q中的每个键值对按照键的字母顺序升序排序,得到排序后的请求字符串qs;
2. 加入当前时间的Unix 时间戳和Spark 平台帐号对应的API Key 值,得到散列前的字符串qf:
qf ← qs&time=12345&salt=aSdF1234
3. 计算得到qf 的md5 值,假设为abcdefg
hash ←md5(qf)
4. 最终的HashedQueryString 为:
hqs ← qs&time=12345&hash=abcdefg
用hqs 代替q 进行Http 通信。
下面举一个例子说明计算过程。假设用户从 Spark 获取到的 API Key 值是 aSdF1234, 当前时间为2010年12月9日15点23分12秒,原始的QueryString 是
name=harry&level=top&salary=1000
第一步,将上述 QueryString 按照字母顺序进行升序排序,结果是
level=top&name=harry&salary=1000
第二步,附加 time 值和 salt 值,得到取 hash 前的字符串
level=top&name=harry&salary=1000&time=1291879392&salt=aSdF1234
第三步,对上述字符串取 md5 值
hash=BF04A55B30CFF562F7ADD9F054AB7FFB
因此,最终进行 Http 通信的字符串为level=top&name=harry&salary=1000&time=1291879392&hash=BF04A55B30CFF562F7ADD9F054AB7FFB