1 Zakład Bioinformatyki, Instytut Informatyki, Uniwersytet w Białymstoku

Correspondence: Jarosław Kotowicz <>

1 Książki i inne rzeczy

  1. R for Data Science
  2. ggplot2: Elegant Graphics for Data Analysis
  3. Colors in R
  4. Ściągi na stronie www.rpubs.com
  5. Zbiory danych na stronie Jareda P. Lander i fueleconomy.gov

2 Rozkłady w R (rysowanie dystrybuant i gęstości rozkładów, dystrybuanty empirycznych - praca z ggplot2)

Wykonaj następujące polecenia:

  1. Ze strony Download Fuel Economy Data zapisz plik ze zbioru Datasets for All Model Years (1984–2020) (plik csv skompresowany) nazwa: Zipped CSV File.
  2. W R go rozpakuj.
  3. Podczytaj dokumentację do tego pliku (w tym samym wierszu co zbiór danych nazwa: Documentation)
  4. Wybieramy zmienne
  1. Wydziel ze zbioru danych dwa podzbiory aut używających paliwa typu: fuelType1 i fuelType2 (operacją filtrowania po niezerowych obserwacjach dotyczących np. zużycia paliwa).
  2. Wykonaj na podzbiorach podsumowania dotyczące każdej ze zmiennych (średnia, warianacja, odchylenie standardowe min, max itp).
  3. Dla każdej zmiennej wykonuj w ggplot2 rysunki:
  1. Ustal ziarno generatora liczb pseudolosowych poleceniem set.seed(18032020)
  2. Korzystając z generatoróW liczb pseudolosowych rozkładów normalnego i gamma (rnorm i rgamma), dla dwóch par różnych parametróW dla każdego z nich, wygeneruj po 200 liczb psuedolosowych. Masz mieć 4 ciągi liczb.
  3. Narysuj dla nich histogramy i dystrybuantę emiryczną.
  4. Prześli skryp R do dnia 25 marca br.

W razie pytań porszę o kontak e-mailowy.

3 Praca domowa z dnia 18 marca 2020r. (do laboratorium)

  1. Proszę wygenerować przy pomocy co najmniej 8 różnych generatorów liczb pseudolosowych (różne rozkłady prawdopodobieństwa) ciągi 200 liczb pseudolosowych. Proszę ustawić ziarno generatora liczbą psudolosowych na 18032020.
  2. Dla wylosowanych ciągów proszę narysować histogramy i dystrybuanty empiryczne. Termin przesłania 1 kwietnia br.
  3. Proszę się zapoznać na następne laboratoria ze sposobami liczenia przedziałów ufności Bibliotek rcompanion, 9. Calculating Confidence Intervals i How to Calculate Confidence Interval in R?.

Uwaga.

Nazwa pliku i tytuł e-maila ze skryptem z laboratorium i z pracą domową powinieny być zgodny ze następującym schematem NumerAlbumu_Nazwisko_PDxx lub NumerAlbumu_Nazwisko_Labxx, gdzie xx onacza numer pracy domowej lub zajęć laboratorium. Pracę domową i skrypt z laboratorium wysyłają Państwo oddzielnie!

.

LS0tDQp0aXRsZTogIlN0YXR5c3R5a2EgbWF0ZW1hdHljem5hIChpbmZvcm1hdHlrYSBpIGVrb25vbWV0cmlhKSAtIGxhYm9yYXRvcml1bSAiDQphdXRob3I6DQotIEphcm9zxYJhdyBLb3Rvd2ljejoNCiAgICBjb3JyZXNwb25kZW5jZTogbm8NCiAgICBlbWFpbDogai5rb3Rvd2ljekB1d2IuZWR1LnBsDQogICAgaW5zdGl0dXRlOiBJSVV3Qg0KZGF0ZTogIjE3IG1hcmNhIDIwMjAiDQpvdXRwdXQ6DQogIGh0bWxfbm90ZWJvb2s6DQogICAgZmlnX2NhcHRpb246IHllcw0KICAgIGhpZ2hsaWdodDogaGFkZG9jaw0KICAgIG51bWJlcl9zZWN0aW9uczogeWVzDQogICAgcGFuZG9jX2FyZ3M6DQogICAgLSAtLWx1YS1maWx0ZXI9c2Nob2xhcmx5LW1ldGFkYXRhLmx1YQ0KICAgIC0gLS1sdWEtZmlsdGVyPWF1dGhvci1pbmZvLWJsb2Nrcy5sdWENCiAgICB0aGVtZTogY2VydWxlYW4NCiAgICB0b2M6IHllcw0KaW5zdGl0dXRlOg0KLSBJSVV3QjogWmFrxYJhZCBCaW9pbmZvcm1hdHlraSwgSW5zdHl0dXQgSW5mb3JtYXR5a2ksIFVuaXdlcnN5dGV0IHcgQmlhxYJ5bXN0b2t1DQpjc2w6IGJpZy1kYXRhLWFuZC1pbmZvcm1hdGlvbi1hbmFseXRpY3MuY3NsDQphbHdheXNfYWxsb3dfaHRtbDogeWVzDQotLS0NCg0KYGBge3Igc2V0dXAsIGluY2x1ZGU9RkFMU0V9DQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUpDQpgYGANCg0KIyBLc2nEhcW8a2kgaSBpbm5lIHJ6ZWN6eQ0KDQoxLiBbUiBmb3IgRGF0YSBTY2llbmNlXShodHRwczovL3I0ZHMuaGFkLmNvLm56L2luZGV4Lmh0bWwpDQoyLiBbZ2dwbG90MjogRWxlZ2FudCBHcmFwaGljcyBmb3IgRGF0YSBBbmFseXNpc10oaHR0cHM6Ly9nZ3Bsb3QyLWJvb2sub3JnLykNCjMuIFtDb2xvcnMgaW4gUl0oaHR0cDovL3d3dy5zdGF0LmNvbHVtYmlhLmVkdS9+dHpoZW5nL2ZpbGVzL1Jjb2xvci5wZGYpDQo0LiBbxZpjacSFZ2kgbmEgc3Ryb25pZSB3d3cucnB1YnMuY29tXShodHRwczovL3d3dy5ycHVicy5jb20vKQ0KNS4gWmJpb3J5IGRhbnljaCBuYSBzdHJvbmllIFtKYXJlZGEgUC4gTGFuZGVyXShodHRwOi8vd3d3LmphcmVkbGFuZGVyLmNvbS9kYXRhLykgaQ0KW2Z1ZWxlY29ub215Lmdvdl0oaHR0cHM6Ly9mdWVsZWNvbm9teS5nb3YvZmVnL2Rvd25sb2FkLnNodG1sKQ0KDQojIFJvemvFgmFkeSB3IFIgKHJ5c293YW5pZSBkeXN0cnlidWFudCBpIGfEmXN0b8WbY2kgcm96a8WCYWTDs3csIGR5c3RyeWJ1YW50eSBlbXBpcnljem55Y2ggLSBwcmFjYSB6IGdncGxvdDIpDQoNCld5a29uYWogbmFzdMSZcHVqxIVjZSBwb2xlY2VuaWE6DQoNCjEuIFplIHN0cm9ueSBbRG93bmxvYWQgRnVlbCBFY29ub215IERhdGFdKGh0dHBzOi8vZnVlbGVjb25vbXkuZ292L2ZlZy9kb3dubG9hZC5zaHRtbCkgemFwaXN6IHBsaWsNCnplIHpiaW9ydSBEYXRhc2V0cyBmb3IgQWxsIE1vZGVsIFllYXJzICgxOTg04oCTMjAyMCkgKHBsaWsgY3N2IHNrb21wcmVzb3dhbnkpIG5hendhOiAqKlppcHBlZCBDU1YgRmlsZSoqLg0KMi4gVyBSIGdvIHJvenBha3VqLg0KMy4gUG9kY3p5dGFqIGRva3VtZW50YWNqxJkgZG8gdGVnbyBwbGlrdSAodyB0eW0gc2FteW0gd2llcnN6dSBjbyB6YmnDs3IgZGFueWNoIG5hendhOiAqKkRvY3VtZW50YXRpb24qKikgDQo0LiBXeWJpZXJhbXkgem1pZW5uZSANCiAgLSBiYXJyZWxzMDggKGFubnVhbCBwZXRyb2xldW0gY29uc3VtcHRpb24gaW4gYmFycmVscyBmb3IgZnVlbFR5cGUxKSwgDQogIC0gYmFycmVsc0EwOCAoYW5udWFsIHBldHJvbGV1bSBjb25zdW1wdGlvbiBpbiBiYXJyZWxzIGZvciBmdWVsVHlwZTIpLA0KICAtIGNpdHkwOCAoY2l0eSBNUEcgZm9yIGZ1ZWxUeXBlMSksDQogIC0gY2l0eUEwOCAgKGNpdHkgTVBHIGZvciBmdWVsVHlwZTIpLA0KICAtIGNvMiAodGFpbHBpcGUgQ08yIGluIGdyYW1zL21pbGUgZm9yIGZ1ZWxUeXBlMSksDQogIC0gY28yQSAodGFpbHBpcGUgQ08yIGluIGdyYW1zL21pbGUgZm9yIGZ1ZWxUeXBlMikuDQo1LiBXeWR6aWVsIHplIHpiaW9ydSBkYW55Y2ggZHdhIHBvZHpiaW9yeSBhdXQgdcW8eXdhasSFY3ljaCBwYWxpd2EgdHlwdTogZnVlbFR5cGUxIGkgZnVlbFR5cGUyIChvcGVyYWNqxIUgZmlsdHJvd2FuaWEgcG8gbmllemVyb3d5Y2ggb2JzZXJ3YWNqYWNoIGRvdHljesSFY3ljaCBucC4genXFvHljaWEgcGFsaXdhKS4NCjYuIFd5a29uYWogbmEgcG9kemJpb3JhY2ggcG9kc3Vtb3dhbmlhIGRvdHljesSFY2Uga2HFvGRlaiB6ZSB6bWllbm55Y2ggKMWbcmVkbmlhLCB3YXJpYW5hY2phLCBvZGNoeWxlbmllIHN0YW5kYXJkb3dlIG1pbiwgbWF4IGl0cCkuDQo3LiBEbGEga2HFvGRlaiB6bWllbm5laiB3eWtvbnVqIHcgKipnZ3Bsb3QyKiogcnlzdW5raToNCiAgLSBkeXN5dHJ5YnVhbnR5IGVtcGlyeWN6bmVqIHdhcnN0YXdhICoqc3RhdF9lY2RmKiosDQogIC0gd3lrcmVzdSBwdWRlxYJrby13xIVzeSwgaGlzdG9ncmFtdSwgZ8SZc3RvxZtjaS4NCjguIFVzdGFsIHppYXJubyBnZW5lcmF0b3JhIGxpY3piIHBzZXVkb2xvc293eWNoIHBvbGVjZW5pZW0gKipzZXQuc2VlZCgxODAzMjAyMCkqKg0KOS4gS29yenlzdGFqxIVjIHogZ2VuZXJhdG9yw7NXIGxpY3piIHBzZXVkb2xvc293eWNoIHJvemvFgmFkw7N3IG5vcm1hbG5lZ28gaSBnYW1tYSAoKipybm9ybSoqIGkgKipyZ2FtbWEqKiksIGRsYSBkd8OzY2ggcGFyIHLDs8W8bnljaCBwYXJhbWV0csOzVyBkbGEga2HFvGRlZ28geiBuaWNoLCB3eWdlbmVydWogcG8gMjAwIGxpY3piIHBzdWVkb2xvc293eWNoLiBNYXN6IG1pZcSHIDQgY2nEhWdpIGxpY3piLg0KMTAuIE5hcnlzdWogZGxhIG5pY2ggaGlzdG9ncmFteSBpIGR5c3RyeWJ1YW50xJkgZW1pcnljem7EhS4NCjExLiBQcnplxZtsaSBza3J5cCAqKlIqKiBkbyBkbmlhIDI1IG1hcmNhIGJyLg0KDQpXIHJhemllIHB5dGHFhCBwb3JzesSZIG8ga29udGFrIGUtbWFpbG93eS4NCg0KIyBQcmFjYSBkb21vd2EgeiBkbmlhIDE4IG1hcmNhIDIwMjByLiAoZG8gbGFib3JhdG9yaXVtKQ0KDQoxLiBQcm9zesSZIHd5Z2VuZXJvd2HEhyBwcnp5IHBvbW9jeSBjbyBuYWptbmllaiA4IHLDs8W8bnljaCBnZW5lcmF0b3LDs3cgbGljemIgcHNldWRvbG9zb3d5Y2ggKHLDs8W8bmUgcm96a8WCYWR5IHByYXdkb3BvZG9iaWXFhHN0d2EpIGNpxIVnaSAyMDAgbGljemIgcHNldWRvbG9zb3d5Y2guIFByb3N6xJkgdXN0YXdpxIcgemlhcm5vIGdlbmVyYXRvcmEgbGljemLEhSBwc3Vkb2xvc293eWNoIG5hICoqMTgwMzIwMjAqKi4NCjIuIERsYSB3eWxvc293YW55Y2ggY2nEhWfDs3cgcHJvc3rEmSBuYXJ5c293YcSHIGhpc3RvZ3JhbXkgaSBkeXN0cnlidWFudHkgZW1waXJ5Y3puZS4NCjxzcGFuIHN0eWxlID0gImNvbG9yOiByZWQiPiBUZXJtaW4gcHJ6ZXPFgmFuaWEgMSBrd2lldG5pYSBici4gPC9zcGFuPg0KMy4gUHJvc3rEmSBzacSZIHphcG96bmHEhyBuYSBuYXN0xJlwbmUgbGFib3JhdG9yaWEgemUgc3Bvc29iYW1pIGxpY3plbmlhIHByemVkemlhxYLDs3cgdWZub8WbY2kNCltCaWJsaW90ZWsgcmNvbXBhbmlvbl0oaHR0cHM6Ly9yY29tcGFuaW9uLm9yZy9oYW5kYm9vay9DXzAzLmh0bWwpLCBbOS4gQ2FsY3VsYXRpbmcgQ29uZmlkZW5jZSBJbnRlcnZhbHNdKGh0dHBzOi8vd3d3LmN5Y2xpc21vLm9yZy90dXRvcmlhbC9SL2NvbmZpZGVuY2UuaHRtbCkgaSBbSG93IHRvIENhbGN1bGF0ZSBDb25maWRlbmNlIEludGVydmFsIGluIFI/XShodHRwczovL2RhdGFzaGFya2llLmNvbS9ob3ctdG8tY2FsY3VsYXRlLWNvbmZpZGVuY2UtaW50ZXJ2YWwtaW4tci8pLg0KDQogPGNlbnRlcj48aDI+PHNwYW4gc3R5bGUgPSAiY29sb3I6IHJlZCI+VXdhZ2EuPC9zcGFuPjwvaDI+PC9jZW50ZXI+IDxoMz5OYXp3YSBwbGlrdSBpIHR5dHXFgiBlLW1haWxhIHplIHNrcnlwdGVtIHogbGFib3JhdG9yaXVtIGkgeiBwcmFjxIUgZG9tb3fEhSBwb3dpbmllbnkgYnnEhyB6Z29kbnkgemUgbmFzdMSZcHVqxIVjeW0gc2NoZW1hdGVtICoqTnVtZXJBbGJ1bXVfTmF6d2lza29fUER4eCoqIGx1YiAqKk51bWVyQWxidW11X05hendpc2tvX0xhYnh4KiosIGdkemllIHh4IG9uYWN6YSBudW1lciBwcmFjeSBkb21vd2VqIGx1YiB6YWrEmcSHIGxhYm9yYXRvcml1bS4gUHJhY8SZIGRvbW93xIUgaSBza3J5cHQgeiBsYWJvcmF0b3JpdW0gd3lzecWCYWrEhSBQYcWEc3R3byBvZGR6aWVsbmllITwvaDM+Lg0KDQo=