Du er ikke logget inn. Så lenge du ikke er logget inn går du glipp av muligheten for å holde styr på din egen progresjon.

Logg inn

Valgte tags:

Filtrering:

Skriv ut:

NoReC-øving 2

Les gjennom NoReC-øving 0 og svar på oppgavene under. Bruk de fire første metodene til disse oppgavene.

Oppgave 1)

Hvor mange forfattere har skrevet anmeldelser som er med i NoReC? Hvilke ti forfattere har skrevet flest anmeldelser? Hvor mange anmeldelser har den forfatteren som har skrevet flest anmeldelser skrevet? Hvilke antagelser gjør vi eventuelt her?

Oppgave 2)

Skriv en funksjon som returnerer forfatterne til ti tilfeldige dokumenter.

Oppgave 3)

Hvor mange dokumenter som er det som har fått de forskjellige terningkastene ("rating")? Hvilke terningkast er det flest av?

Oppgave 4)

Hvor mange anmeldelser er på nynorsk? Hvor mange forfattere skriver på nynorsk? Hvor mange skriver på bokmål? Er det noen forfattere som skriver på begge målformer? Skriv en ny tabell som i oppgave 2, men fordel antall anmeldelser på nynorsk og bokmål. Er det noen kategorier som er over- eller underrepresenterte på nynorsk eller bokmål?

Vis løsningsforslag

Løsningsforslag:

Oppgave 1

Disse oppgavene baserer seg i stor grad på metadataene vi henter ut fra dokumentene.

author_count = Counter()
for d in docs:
  authors = norec.get_metadata(d)["authors"]
  for author in authors:
    author_count[author] += 1

print("Antall forfattere: ",len(author_count))
print("De ti mest produktive: ")
for auth in author_count.most_common(10):
  print("\t",auth)
mest_prod = author_count.most_common(1)[0]
print("Den mest produktive forfatteren '{}' har skrevet {} anmeldelser".format(mest_prod[0],mest_prod[1]))

utskrift:

Antall forfattere: 478
De ti mest produktive:
     ('Redaksjonen', 8517)
     ('Arild Abrahamsen', 1789)
     ('Birger Vestmo', 1487)
     ('Morten Ståle Nilsen', 1477)
     ('Stein Østbø', 1425)
     ('Jon Selås', 1005)
     ('Kristin Aalen', 874)
     ('Geir Flatøe', 697)
     ('Thomas Talseth', 663)
     ('Tor Martin Bøe', 564)
Den mest produktive forfatteren 'Redaksjonen' har skrevet 8517 anmeldelser

En av antagelsene vi må gjøre er at ingen forfattere har samme navn.

Oppgave 2

Løsningsforslag under utvikling.

Oppgave 3
Løsningsforslag under utvikling.