====
论文
====

======
Python
=====
=

=========
Tensorflow
=========

=======
PyTorch
=======

=====
Keras
=====

====
专题
====

====
链接
====

====
视频

====

=======
药物设计

=======

=======
材料科学
=======

============
经济学与金融学
==========
==


一般文献 药物设计 药物数据库文献 DNA序列分析 氨基酸序列分析 计算神经科学 医学图像处理 AI顶刊文献
图神经网络 自然语言处理            

==========
氨基酸序列

==========

1. A 2D Non-degeneracy Graphical Representation of Protein Sequence and Its Applications. CURRENT BIOINFORMATICS 卷: ‏ 15 期: ‏ 7 页: ‏ 758-766 出版年 ‏
背景:蛋白质序列比较是生物信息学的一个重要研究领域。许多无对准的方法已经被提出。
目的:为了挖掘蛋白质序列的更多信息,本研究基于氨基酸的理化性质,提出一种新的无比对方法。
方法:定义平均理化值(Apv)。对于给定的蛋白质序列,根据Apv和氨基酸的位置勾画出一条二维曲线,曲线上不存在环状和交叉。根据该曲线可以分析蛋白质序列的相似性/相异性。
结果与结论:以两组蛋白质序列为例说明了新方法的有效性,该方法能正确地对蛋白质序列进行分类,结果与ClustalW方法的结果具有很好的相关性。新方法简单有效。

2. DCGR: feature extractions from protein sequences based on CGR via remodeling multiple information. BMC BIOINFORMATICS 卷: ‏ 20 文献号: 351 出版年: ‏ JUN 20 2019
背景蛋白质特征提取在蛋白质序列的相似性分析以及蛋白质结构、功能和相互作用的预测等领域发挥着重要作用。基于图形表示的特征提取是最有效的方法之一。然而,大多数现有的方法都受到其方法的限制设计结果We介绍了一种基于混沌博弈表示的蛋白质序列特征提取方法DCGR,该方法是根据氨基酸的理化性质构造蛋白质序列的CGR曲线,然后进行转换利用CGR图像中点的分布,将CGR曲线转化为多维特征向量。在五个数据集上测试,DCGR显著优于最先进的特征提取方法:结论DCGR在从蛋白质序列中提取有效特征方面具有很强的实用性,因此在蛋白质序列的相似性分析中具有重要意义,蛋白质相互作用的研究和蛋白质功能的预测。免费提供https://sourceforge.net/projects/transcriptomeassembly/files/Feature%20Extraction。

3. A novel descriptor of protein sequences and its application. JOURNAL OF THEORETICAL BIOLOGY 卷: ‏ 347 页: ‏ 109-117 出版年: ‏ APR 21 2014
基于氨基酸的三种物理化学性质,提出了一种蛋白质序列的动态三维图形表示方法。图形坐标具有直接的生物学意义,可以反映蛋白质的固有结构。提取了主转动惯量和轴坐标范围信息作为一种新的混合描述符,并将其用于蛋白质一级序列的比较。同时,利用归一化描述向量的欧氏距离作为蛋白质相似性的定量度量,避免了蛋白质序列长度差异的影响。最后,以9个ND5(NADH脱氢酶亚基5)蛋白为例,说明了本文方法的有效性。

4. 20D-dynamic representation of protein sequences. GENOMICS 卷: ‏ 107 期: ‏ 1 页: ‏ 16-23 出版年: ‏ JAN 2016.
提出了一种比较蛋白质序列的新方法。氨基酸序列由一组点质量在20D空间中表示。应用在20D空间中行走的方法,得到空间中的点分布。将20D表示投影到2D或3D空间说明了特定氨基酸沿着序列的分布。提出了20D转动惯量作为蛋白质序列的新描述因子。

5. A novel numerical representation for proteins: Three-dimensional Chaos Game Representation and its Extended Natural Vector. COMPUTATIONAL AND STRUCTURAL BIOTECHNOLOGY JOURNAL 卷: ‏ 18 页: ‏ 1904-1913 出版年: ‏ 2020
混沌对策表示(CGR)最早被提出作为DNA的一种图像表示方法,并被推广到其他生物大分子的情况。与DNA的CGR图像相比,现有的蛋白质CGR图像在几何上不太优美,点在CGR图像中的分布含义也不太明显。在这项研究中,我们通过将20个氨基酸自然地分布在一个正十二面体的顶点上,提出了一种新的基于CGR方法的蛋白质序列三维图像表示方法。我们还将每个CGR图像与高维欧几里德空间中的一个向量相关联,称为扩展自然向量(ENV),以便分析CGR图像中包含的信息。基于蛋白质分类和系统发育分析的结果,我们的方法可以作为发现蛋白质间生物关系的精确方法。

6. Deep learning on chaos game representation for proteins. BIOINFORMATICS 卷: ‏ 36 期: ‏ 1 页: ‏ 272-279 出版年: ‏ JAN 1 2020
蛋白质序列的动机分类是生物信息学的一项重要任务,有着广泛的应用。不同的机器学习方法存在并应用于这些问题,如支持向量机(SVM)、随机森林(RF)和神经网络(NN)。所有这些方法都有一个共同点,即蛋白质序列在第一步必须是机器可读的和可比较的,因为存在不同的编码。这些编码通常基于序列的物理或化学性质。然而,由于深度神经网络(DNN)在图像识别方面的突出性能,我们采用频率矩阵混沌对策表示(FCGR)将蛋白质序列编码到图像中。在这项研究中,我们比较了支持向量机,RFs和DNNs的性能,训练FCGR编码的蛋白质序列。原始的混沌博弈表示(CGR)主要用于基因组序列的编码和分类,我们对其进行了改进,使其也适用于蛋白质序列,得到了n片表示,一个具有多个图标的图像。

人工智能

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。

上海市浦东新区沪城环路999号