许多最新的应用程序要求对天生数字复合图像进行文本分割。 为此,我们提出了一种从粗到细的框架,用于分割天生数字复合图像中任意比例和方向的文本。 在粗略阶段,根据字符的变化分布设计局部图像活动度量,以突出显示文本区域和图形区域之间的差异。 此阶段输出一个粗略的文本层,其中包括文本区域以及一些具有较高活动性的图形区域。 在精细阶段,提出了一种基于文本连接组件(TCC)的细化方法,以消除残存的图像区域。 特别是,提出了一种尺度和方向不变的分组算法,以自适应地生成具有统一统计特征的TCC。 最小平均距离和形态学运算用于辅助候选TCC的形成。 然后,设计了三个字符串级特征(即,形状,颜色相似度和平均活动水平),以区分真实的TCC和通过连接高活动图形组件形成的假阳性TCC。 大量的实验表明,所提出的框架可以从出生的数字复合图像中精确地分割出文本区域,同时保留了具有不同比例和方向的文本的完整性,并避免了文本区域的过度连接。