HowtoReadJavaScriptObjectsUsingXPath/HTMLAgilityPack对于我的爬虫项目,我需要从JavaScript对象中获取产品详细信息。如何从以下JavaScript中有效地获取对象详细信息?我使用XPath和HTMLAgilityPack。varproduct={identifier:'2051189775',//产品IDfn:'Fit-WhiskeredDarkWashSkirt',category:['sale'],brand:'BrandName',price:'22.90',//这会bethediscountpriceamount:'31.80',//这将是原价currency:'USD',//Listcanmemore.};我以前没有尝试过从JavaScript对象获取详细信息。我直接从HTML获取其他爬虫的详细信息。由于HTMLAgilityPack不会评估HTML的任何内容,因此应仅将javascript代码视为纯文本。使用SelectSingleNode方法找到Javascript,然后只需抓取InnerHtml即可获取内容。要么找到一个C#javascript解析器(例如IronJS),要么使用标准文本操作技术(String.*或Regex)编写一个解析器来提取您想要的位。一旦你有了大括号之间的位,你就可以使用前面提到的解析器或像Json.NET这样的库来解析它们,因为花括号之间的片段似乎是有效的json。以上就是C#学习教程:如何使用XPath/HTMLAgilityPack读取JavaScript对象共享的所有内容。如果对你有用,需要进一步了解C#学习教程,希望大家多多关注。本文收集自网络,不代表立场。如涉及侵权,请点击右侧联系管理员删除。如需转载请注明出处:
