Docker跟一般的虚拟机有什么区别?

这是StackOverflow上的一个问题及其回答的翻译(原文:Docker.io跟一般的虚拟机有什么区别?)。原文主要回答了三个问题:Docker.io的基本原理是什么?为什么在docker中部署软件很方便?docker是如何保存系统镜像的?前两个问题是主问题,最后一个问题是有人在评论中提出的,原作者也做了回答。
Continue reading

生命科学中的大数据

*这是跟余昶同学一起为《程序员》杂志2013年第2期大数据专刊撰写的文章,根据跟杂志社的协议,现将未经编辑的版本全文转发于此。

跟电子商务、社交网络或政务信息相比较,大部分IT从业人员对生命科学是陌生的,对于生命科学中的数据分析几近闻所未闻。但生命科学正越来越成为一门大数据驱动的科学。以测序仪为例,一台高通量的测序仪每天大概产生100GB的数据。光在华大基因,就有一百多台这样的测序仪在满负荷的运行着,为生物研究、药物研发、临床健康、农林渔牧等行业提供大量的基础数据。此外,生物体的复杂性意味着我们需要整合很多不同类型的数据才能展开有效的分析和研究,测序仪所产生的序列数据还只是其中的一小部分而已。这其中的数据规模绝不亚于电子商务和社交网络等热门领域。

现在,孩子是每个家庭的重中之重,所以让我们从孩子健康开始,说说生命科学中的数据分析和大数据吧。

Continue reading

Cytoscape 3 Simple App 开发

历经磨难,Cytoscape终于迎来了3.0的发布。API完全不兼容了,各种插件必须要升级才能在3.0中运行。

追随乔大爷的脚步,Cytoscape 3.0的插件(plug-in)改名叫应用(app),还开了一个App Store。看看Cytoscape的红火,各行各业都是打造产业链和共赢的生态环境才能获得大的成功,互联网如此,移动设备如此,生命科学也是如此。不仅仅是API的变动,开发方式也发生了巨大的改变。为了一定程度上的兼容性,Cytoscape 3.0中的应用分为两种:

  • 简单应用(simple App):基本等同于以前2.X版本中的插件,开发方式基本一致;
  • 套装应用(Bundle App):基于OGSi的应用,可以为其他应用提供API、不会出现库的版本冲突等。

先说说简单应用的开发,给个最简单的例子,例子来自Creating a Simple Cytoscape 3 App,稍作修改和说明。

Continue reading

发文一篇

不是学术论文。赶着遇上《程序员》杂志2013年第二期的专题是大数据,就跟余昶同学一起写了一篇几乎科普的文章《生命科学中的大数据》,最终以远快于任何学术论文的速度被接受和发表。根据杂志社的要求,这篇文章大概会在三月中旬左右发布到我的博客上。

杂志出街没几天,就有了反馈。文章最后提及中科院计算所做蛋白质组学数据分析的王乐珩同学跳槽阿里云,以及阿里云参加深圳生物技术大会。王乐珩同学在其博客上做了说明:

Continue reading

肿瘤学 笔记 第一篇 肿瘤流行病学 第五章 肿瘤预防

第一节 肿瘤的三级预防

  • 一级预防:针对比较明确的致癌因素采取积极型预防措施,比较明显的还是只有HPV筛查降低宫颈癌的发病率
  • 二级预防:通过筛查和早期诊断,降低高危人群的发病率,乳腺筛查、胃癌筛查等等。
  • 三级预防:治疗,延长寿命,提高生存质量。

Continue reading

肿瘤学 笔记 第一篇 肿瘤流行病学 第四章 肿瘤分子流行病学

第一节 概述

肿瘤分子流行病学(cancer molecular epidemiology)。最大的成就应该还是HPV跟宫颈癌的关系的确定。

第二节 致癌物暴露的检测

检测致癌物-DNA加合物和致癌物代谢产物。通过尿液、血清、组织细胞瘤直接定量测定。常用监测方法:

  1. ^{32}P-后标记法
    1981年Randerath和Gupta发明,是当前灵敏度最高、应用最为广泛的DNA加合物检测方法。基本步骤:DNA降解为脱氧3′-单核苷酸,在T4多聚核苷酸激酶的作用下,将^{32}P标记到5′段,形成3′,5′-二磷酸核苷;经多向薄膜层析分离出^{32}P标记的加合物;通过放射活性测定加合物的含量。可定量测定,可重复性好,但不安全,有污染。
    Continue reading

肿瘤学 笔记 第一篇 肿瘤流行病学 第三章 肿瘤流行病学研究方法

第一节 描述流行病学

描述流行病学(descriptive epidemiology)是描述恶性肿瘤在人群、时间和空间的频率分布。跟统计学类比的话,就像是描述统计量一样,试图用若干个数据指标去描述整体的大致情况。在肿瘤流行病学中常用的描述指标有发病率、时间点患病率、时间段患病率、死亡率、生存率等。

现况研究,又称现况调查(prevalence survey)或者是横断面研究(cross-sectional study),可以分为普查(census)和 抽样调查(sampling survey)。
Continue reading