# KEGG注释原理：假设在某一些特定类型的代谢过程而言，其反应底物和反应产物的区别仅仅在于一些基团的加减，
# 则二级结构应该是比较相似的
# 故而，对于一个反应过程 A <=> B ，假若数据库之中没有找B的二级数据，但是却找到了A的二级数据，
# 那么就可以通过这个原理来进行B的注释

# 算法计算过程
#
# 1. 在通过SSM鉴定之后，大致可以依据二级结果的相似度将sample分为已鉴定代谢物和未鉴定代谢物
# 2. 对未鉴定代谢物进行遍历，通过未鉴定的代谢物的mz进行KEGG代谢物的一级查找，找出所有的可能结果
# 3. 将查找到的KEGG编号从已鉴定代谢物之中取补集，即取出已鉴定代谢物之中不存在的KEGG编号
# 4. 利用KEGG代谢反应过程找出和未鉴定代谢物的KEGG编号相匹配的同过程内的KEGG代谢物对应的已鉴定代谢物的二级质谱信息
# 5. 进行二级比较，如果二级相似度较高，则确认该未鉴定代谢物可能为某一个KEGG编号