正则表达式提取标签

shya 2021-08-27 原文

功能用途

主要实现了提取html代码中的a标签和url地址。

示例代码

     Regex regex = new Regex("href\\s*=\\s*(?:\"(?<1>[^\"]*)\"|(?<1>\\S+))", RegexOptions.IgnoreCase);
            Regex regex1 = new Regex(@"\<a.*href\s*=\s*(?:""(?<url>[^""]*)""|\'(?<url>[^\']*)\'|(?<url>[^\>^\s]+)).*\>(?<title>[^\<^\>]*)\<[^\</a\>]*/a\>", RegexOptions.IgnoreCase);

            for (Match m = regex1.Match(pageindex); m.Success; m = m.NextMatch())
            {
                string tempurl = m.Groups[1].Value.ToString();
                string title = m.Groups[2].Value.ToString();
}

版权声明：本文为shya原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/shya/p/2439446.html

正则表达式提取 标签的更多相关文章

正则表达式查找网页源代码提取指定内容
import requestsimport re txt=\'<a href=”https: […]...
Python语言学习第十篇：正则表达式 – re
规则表达式（Regular Expression， RE），又称作正则表达式，通常用于检索、替换符合指定规则的 […]...
正则表达式处理 pdf 复制之后的段内换行和段内空格问题问题导向！！！！
————恢复内容开始——— […]...
Python 正则表达式匹配任意字符
　　.(句点)匹配除了换行之外的所有一个字符， .*(点-星)匹配除了换行外的所有字符 >>> […]...
正则表达式
1.关于正则表达式　　处理字符串时，有很多较为复杂的字符串用普通的字符串处理函数无法干净的完成。比如说，可能 […]...
正则表达式——Java程序员懂你
正则表达式关键字：正则表达式，Pattern，Matcher，字符串方法，split，replace 前文书 […]...
C++ 正则表达式零宽断言 lookbehind
正则表达式零宽断言适用场景：匹配/提取/查找/替换以 xxx 开头，或以 xxx 结尾，但不包括 xxx 的 […]...
java 正则表达式手机号邮箱
package com.modules.plateform.tool; import java.util.re […]...

随机推荐

TKStudio 介绍，非常强大的一款集成开发环境，仅仅当个文本编辑、代码查看也是非常不错的。
1. TKStudio概述 TKStudio集成开发环境是广州致远电子股份有限公司开发的一个嵌入式芯片级、系统 […]...
浅谈单页应用和多页应用——Vue.js向
浅谈单页应用和多页应用——Vue.js向多页面多页面应用：每次页面跳转，后台都会返回一个新的HTML文档， […]...
ReentrantLock源码探究1:非公平锁的获取和释放
1.AQS简单介绍 Sync是ReentrantLock的一个内部类，它继承了AbstractQueued […]...
示波器AC档与DC档
1 示波器的AC档与DC档有什么区别用Multisim软件进行电路仿真时，示波器有两个档位：AC档与DC档。 […]...
该事件由时间敏感的网络TSN以太网TTE触发
昨天的独角兽其他htmaid网络TTE和TSN的关系 TSN似乎是确定一段时间内以太网的一组标准，而TTE是满 […]...
STM8S之时钟设置
昨天被安排做别的工作，耽误一天，今天继续写，坚持学习。 1，STM8S的4种时钟源可用做主时钟： ● 1-24 […]...
GO 第一个程序Hello world
第一个程序：HelloWorld 一、go项目工程结构配置好工作目录后，就可以编码开发了，在这之前，我们看下 […]...
python Deep learning 学习笔记（6）
本节介绍循环神经网络及其优化循环神经网络（RNN，recurrent neural network）处理序列的 […]...

展开目录

目录导航