当前位置: 首页 > Web前端 > JavaScript

OpenOfficeXML格式如何描述具有不同字体设置的多个段落

时间:2023-03-27 12:02:40 JavaScript

_rels.rels这定义了告诉MSWord在哪里可以找到文档内容的引用。在这种情况下,它引用word/document.xml:_RELS/DOCUMENT.XML.RELS该文件定义了对文档内容中嵌入的资源(例如图像)的引用。如果我们的简单文档没有嵌入资源,则关系标记为空:[CONTENT_TYPES].XML[Content_Types].xml包含有关文档中媒体类型的信息。因为我们只有文本内容,所以很简单:DOCUMENT.XML这是包含文档文本内容的主要XML。在此文件中,开发人员会发现文档中一些未使用的命名空间引用,但请注意,我们不应删除它们,因为它们是MSWord所必需的。这是我们的简化示例:测试主节点代表文档本身,包含段落,中嵌套的是定义的页面大小。是一个可忽略的属性;它由MSWord在内部使用。让我们看一个包含三个段落的更复杂的文档。我在MicrosoftWord屏幕截图中用相同颜色突出显示了XML,因此我们可以看到依赖项:Word文档中的文本,包装在成对的标签w:t中。字体通过w:rFont标签指定。颜色通过w:color指定。新段落,由w:p指定。在w:p中,仍然是w:t。段落结构一个简单的文档由段落组成,一个段落由一个系列组成(一系列具有相同字体、颜色等的文本),一个系列组成字符(如)组成。标签内可能有多个字符,同一个运行结构中可能有多个字符。文本属性基本的文本属性包括字体、大小、颜色、样式等。大约有40个标签用于指定文本外观。正如您在我们的三段示例中所见,每一行在中都有自己的属性,指定和粗体。需要注意的重要一点是,属性区分两组字符,普通脚本和复杂脚本(例如阿拉伯语),并且属性根据其影响的字符类型具有不同的标记。大多数普通脚本属性标签都有一个匹配的复杂脚本标签,其中添加了C以指定该属性用于复杂脚本。例如:(斜体)变为,普通脚本的粗体标记变为复杂脚本的