面向合成生物系统海量工程试错优化的人工智能算法研究与应用
噬菌体-细菌数据集
已获取50752组定量描述噬菌体对细菌毒力的数据,均进行3次生物重复,其中37760组有噬菌体耐受性数据,涵盖的实验细菌与噬菌体种类丰富,具有代表性,基于该数据建立噬菌体-宿主基因型表型数据库
免疫通路数据集
以抗病毒信号通路作为背景,根据RIG-I和cGAS-STING两条信号通路作为骨架,通过主路分子作为被修饰对象进行免疫元件的搜集,包括14个主路分子、800个修饰元件、100个修饰位点、13种修饰类型
微藻ORF数据集
针对原核蓝藻小蛋白(<100氨基酸)开发原核核糖体信号采集技术,利用VAE、GAN、PU等模型改进了人工智能预测模型,对高光条件、缺氮条件下小蛋白数据进行筛选
生成噬菌体数据集
基于时序对抗生成网络生成的噬菌体序列数据集,基于噬菌体的全局特征,局部特征和图结构特征信息,设计嵌入组件、变分自编码组件和对抗组件,学习噬菌体全局特征和局部特征的低维表示,元件图结构的低维向量潜在映射,通过对抗拟合三种特征的分布,生成噬菌体序列
蛋白质泛素化位点可视数据集
基于图卷积神经网络的泛素化位点预测,利用蛋白质的空间结构进行泛素化位点预测,将图结构不规则的输入域中映射到规则的域中,使用胶囊表示提取出来的图信息并进行分类,使用图传播正则化为模型提供不同于图卷积模块的新信息