本文共 2296 字,大约阅读时间需要 7 分钟。
用过protobuf的人都知道, protobuf的序列化过程是:
协议文件(.proto) + 原始数据 ====》 buffer
反序列化的过程是:
buffer + 协议文件(.proto) ===>原始数据
那有没有办法实现: buffer ===》原始数据 呢? 这是一个貌似无解的问题, 其实有解。
如果在无协议的情况下, 能实现buffer到原始数据的转化, 那就具有非常重要的意义: 抓包后(抓16进制), 可直接转换成原始数据!!! Oh, my god, 效率呈现指数级提升!!! 着实让人兴奋
之前我学过h.264视频压缩, 原始的yuv数据经过h.264压缩后, 生成压缩视频, 每个字节都有其固定含义, 因此可解码。 类似地, 在protobuf序列化过程中, 也有这样的道理。 序列化后的每个字节都有固定含义, 那么自然就可以对这些有固定意义的字节进行解码, 我们来看看代码:
test.proto内容:
package NS; message PointReq { required int32 x=1; required int32 y=2; }taoge@localhost Desktop>
main.cpp内容:
#include#include using namespace std;#include "test.pb.h"using namespace NS;// 16进制string bufToHexStr(const char *pBuf, int bufLen){ if(NULL == pBuf || bufLen < 0) { return ""; } int i = 0; string sRet = ""; for(i = 0; i < bufLen; i++) { char szTmp[3] = {0}; snprintf(szTmp, sizeof(szTmp), "%02x", (unsigned char)pBuf[i]); sRet += szTmp; } return sRet;}int main(){ PointReq point; point.set_x(10); point.set_y(20); string tmp; bool ret = point.SerializeToString(&tmp); // 这里要传地址 if (ret) { printf("encode ok!\n"); } else { printf("encode error!\n"); return -1; } cout << bufToHexStr(tmp.c_str(), tmp.size()) << endl; PointReq point2; ret = point2.ParseFromString(tmp); if (ret) { printf("decode ok, %d, %d\n", point2.x(), point2.y()); } else { printf("decode error!\n"); return -2; } return 0;}
结果:
taoge@localhost Desktop> make g++ -c -L/usr/local/lib -lprotobuf -o main.o main.cpp g++ -c -L/usr/local/lib -lprotobuf -o test.pb.o test.pb.cc g++: -lprotobuf: linker input file unused because linking not doneg++: -lprotobuf: linker input file unused because linking not doneg++ -L/usr/local/lib -lprotobuf -o main main.o test.pb.o taoge@localhost Desktop> ./main encode ok!080a1014decode ok, 10, 20
上面反序列化依赖于test.proto协议文件。
下面, 我们不依赖于test.proto协议文件(仅仅利用序列化的结果080a1014)来反序列化一下:
如果协议是嵌套的, 那么此处的展示结果也是嵌套的, 有缩进关系, 非常好看, 爽心悦目
这个无协议序反序列化工具是某哥开发的, 所以我就不贴源码了。 无协议反序列化真的很有创意我们工作中, 每个人每天都有多次使用。
当然, 在你的公司, 很可能不用protobuf, 而是用自己公司开发的序列化协议框架, 那也一样, 无协议时可反序列化。有兴趣的朋友可以试着写一下无协议时的反序列化代码(一个字节一个字节地抠), 代码量其实很少!