user3354853
user3354853

Reputation: 187

How to create HTML tags on matching strings using Perl

string_1

< p class="paraind">< i>Erstens werden kulturelle Defizite bzw. ein geringes kulturelles Kapital der Migrantenfamilien angenommen, das unter Bezugnahme auf das kultursoziologisch begr&#x00FC;ndete BORDIEU&#x2019;sche < i>Habituskonzept< /i> und seine These der &#x201A;kulturellen Passung&#x2018; wegen der angenommenen Distanz der Migrantenfamilien zur deutschen (Mittelschicht-)Kultur f&#x00FC;r geringe Bildungschancen von Migrantenkinder verantwortlich sei. BORDIEU und PASSERON benutzen f&#x00FC;r diesen Vergleich des famili&#x00E4;ren kulturellen Kapitals mit dem der < i>Mittelschichtinstitution< /i>< a id="ch1_fn18" href="chapter1.html#cch1_fn18">< sup>18< /sup>< /a> der Schule den durchaus umstrittenen Begriff der &#x201A;kulturellen Passung&#x2018; (1971). Der Erkl&#x00E4;rungsansatz der kulturellen Herkunft als Ursache f&#x00FC;r Bildungs(miss)erfolg erscheint deswegen prinzipiell umstritten und quasiwissenschaftlich, weil viele der Herkunftskultur zugeschriebenen Eigenschaften sich oftmals als soziale Faktoren entpuppen, und weil die Unterstellung einer pauschal defizit&#x00E4;ren Lebenslage, Kultur und Sprachverm&#x00F6;gens nicht-deutscher Familien auf eine kulturalistischessentialistische, wenn nicht sogar diskriminierende Haltung verweist.< /p>

string_2

begr&#x00FC;ndete BORDIEU&#x2019;sche Habituskonzept und seine These der &#x201A;kulturellen

You can see that string_2 contents match with string_1 (highlighted text) but only difference is < i> tag in string_1, So I can not match these two strings

I want to create all the tags from string_1 to its corresponding texts in string_2 to match both string,

Kindly somebody give any idea or solution for this

Upvotes: 0

Views: 63

Answers (1)

Miller
Miller

Reputation: 35198

A less restrictive version of my regex solution to your previous question can solve this:

use strict;
use warnings;

my $string_1 = do {local $/; <DATA>};

my $string_2 = "begr&#x00FC;ndete BORDIEU&#x2019;sche Habituskonzept und seine These der &#x201A;kulturellen";

# Build a regex to match HTML interjected at whitespace
my $string2_re = join '(?:\s+|<.*?>)+', map quotemeta, split ' ', $string_2;

if ($string_1 =~ /($string2_re)/) {
    print "Matching = '$1'";
}

__DATA__
< p class="paraind">< i>Erstens werden kulturelle Defizite bzw. ein geringes kulturelles Kapital der Migrantenfamilien angenommen, das unter Bezugnahme auf das kultursoziologisch begr&#x00FC;ndete BORDIEU&#x2019;sche < i>Habituskonzept< /i> und seine These der &#x201A;kulturellen Passung&#x2018; wegen der angenommenen Distanz der Migrantenfamilien zur deutschen (Mittelschicht-)Kultur f&#x00FC;r geringe Bildungschancen von Migrantenkinder verantwortlich sei. BORDIEU und PASSERON benutzen f&#x00FC;r diesen Vergleich des famili&#x00E4;ren kulturellen Kapitals mit dem der < i>Mittelschichtinstitution< /i>< a id="ch1_fn18" href="chapter1.html#cch1_fn18">< sup>18< /sup>< /a> der Schule den durchaus umstrittenen Begriff der &#x201A;kulturellen Passung&#x2018; (1971). Der Erkl&#x00E4;rungsansatz der kulturellen Herkunft als Ursache f&#x00FC;r Bildungs(miss)erfolg erscheint deswegen prinzipiell umstritten und quasiwissenschaftlich, weil viele der Herkunftskultur zugeschriebenen Eigenschaften sich oftmals als soziale Faktoren entpuppen, und weil die Unterstellung einer pauschal defizit&#x00E4;ren Lebenslage, Kultur und Sprachverm&#x00F6;gens nicht-deutscher Familien auf eine kulturalistischessentialistische, wenn nicht sogar diskriminierende Haltung verweist.< /p>

Outputs:

Matching = 'begr&#x00FC;ndete BORDIEU&#x2019;sche < i>Habituskonzept< /i> und seine These der &#x201A;kulturellen'

Upvotes: 2

Related Questions