1 Zakład Bioinformatyki, Instytut Informatyki, Uniwersytet w Białymstoku

Correspondence: Jarosław Kotowicz <>

1 Książki i inne rzeczy

  1. R for Data Science
  2. ggplot2: Elegant Graphics for Data Analysis
  3. Colors in R
  4. Ściągi na stronie www.rpubs.com
  5. Zbiory danych na stronie Jareda P. Lander i fueleconomy.gov

2 Rozkłady w R (rysowanie dystrybuant i gęstości rozkładów, dystrybuanty empirycznych - praca z ggplot2)

Wykonaj następujące polecenia:

  1. Ze strony Download Fuel Economy Data zapisz plik ze zbioru Datasets for All Model Years (1984–2020) (plik csv skompresowany) nazwa: Zipped CSV File.
  2. W R go rozpakuj.
  3. Podczytaj dokumentację do tego pliku (w tym samym wierszu co zbiór danych nazwa: Documentation)
  4. Wybieramy zmienne
  1. Wydziel ze zbioru danych podzbiór aut używających paliwa typu: electricity (operacją filtrowania po niezerowych obserwacjach dotyczących np. evMotor).
  2. Wykonaj na podzbioze podsumowania dotyczące każdej ze zmiennych liczbowych (średnia, warianacja, odchylenie standardowe min, max itp).
  3. Dla każdej zmiennej liczbowej wykonuj w ggplot2 rysunki:
  1. Ustal ziarno generatora liczb pseudolosowych poleceniem set.seed(19032020)
  2. Korzystając z generatoróW liczb pseudolosowych rozkładów normalnego i beta (rnorm i rbeta), dla dwóch par różnych parametróW dla każdego z nich, wygeneruj po 200 liczb psuedolosowych. Masz mieć 4 ciągi liczb.
  3. Narysuj dla nich histogramy i dystrybuantę emiryczną.
  4. Prześli skryp R do dnia 25 marca br.

W razie pytań porszę o kontak e-mailowy.

3 Praca domowa z dnia 19 marca 2020r. (do laboratorium)

  1. Proszę wygenerować przy pomocy co najmniej 8 różnych generatorów liczb pseudolosowych (różne rozkłady prawdopodobieństwa) ciągi 200 liczb pseudolosowych. Proszę ustawić ziarno generatora liczbą psudolosowych na 19032020.
  2. Dla wylosowanych ciągów proszę narysować histogramy i dystrybuanty empiryczne.
  3. Proszę narysować wykresy gęstości i dystrybuant co najmniej 6 rozkładów prawdopodobieństwa przedstawianych na wykładzie (dla każdego z 5 wariantami parametrów). Gęstości (odpowiednio dystrybuanty) dla danego typu rozkładu mają być umieszczone na jednym rysunku.
  4. Proszę narysować podstawowe statystyki graficzne dla wybranych dwóch zmiennych czynnikowych i dwóch ciągłych (dyskretnych z dużą ilością obserwacji) z jednego ze zbioru acs_ny.csv lub acsNew.csv. Dane są dostępne na stronie Jareda P. Landera (w skrypcie zbiór należy pobrać, odpowiednio zmodyfikować dane i dopiero wtedy można rysować).
    Termin przesłania 2 kwietnia br.
  5. Proszę się zapoznać na następne laboratoria ze sposobami liczenia przedziałów ufności Bibliotek rcompanion, 9. Calculating Confidence Intervals i How to Calculate Confidence Interval in R?.

Uwaga.

Nazwa pliku i tytuł e-maila ze skryptem z laboratorium i z pracą domową powinieny być zgodny ze następującym schematem NumerAlbumu_Nazwisko_PDxx lub NumerAlbumu_Nazwisko_Labxx, gdzie xx onacza numer pracy domowej lub zajęć laboratorium. Pracę domową i skrypt z laboratorium wysyłają Państwo oddzielnie!

.

LS0tDQp0aXRsZTogIk1ldG9keSBwcm9iYWJpbGlzdHljem5lIGkgc3RhdHlzdHlrYSAoaW5mb3JtYXR5a2EpIC0gbGFib3JhdG9yaXVtICINCmF1dGhvcjoNCi0gSmFyb3PFgmF3IEtvdG93aWN6Og0KICAgIGNvcnJlc3BvbmRlbmNlOiBubw0KICAgIGVtYWlsOiBqLmtvdG93aWN6QHV3Yi5lZHUucGwNCiAgICBpbnN0aXR1dGU6IElJVXdCDQpkYXRlOiAiMTkgbWFyY2EgMjAyMCINCm91dHB1dDoNCiAgaHRtbF9ub3RlYm9vazoNCiAgICBmaWdfY2FwdGlvbjogeWVzDQogICAgaGlnaGxpZ2h0OiBoYWRkb2NrDQogICAgbnVtYmVyX3NlY3Rpb25zOiB5ZXMNCiAgICBwYW5kb2NfYXJnczoNCiAgICAtIC0tbHVhLWZpbHRlcj1zY2hvbGFybHktbWV0YWRhdGEubHVhDQogICAgLSAtLWx1YS1maWx0ZXI9YXV0aG9yLWluZm8tYmxvY2tzLmx1YQ0KICAgIHRoZW1lOiBjZXJ1bGVhbg0KICAgIHRvYzogeWVzDQppbnN0aXR1dGU6DQotIElJVXdCOiBaYWvFgmFkIEJpb2luZm9ybWF0eWtpLCBJbnN0eXR1dCBJbmZvcm1hdHlraSwgVW5pd2Vyc3l0ZXQgdyBCaWHFgnltc3Rva3UNCmNzbDogYmlnLWRhdGEtYW5kLWluZm9ybWF0aW9uLWFuYWx5dGljcy5jc2wNCmFsd2F5c19hbGxvd19odG1sOiB5ZXMNCi0tLQ0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0NCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkNCmBgYA0KDQojIEtzacSFxbxraSBpIGlubmUgcnplY3p5DQoNCjEuIFtSIGZvciBEYXRhIFNjaWVuY2VdKGh0dHBzOi8vcjRkcy5oYWQuY28ubnovaW5kZXguaHRtbCkNCjIuIFtnZ3Bsb3QyOiBFbGVnYW50IEdyYXBoaWNzIGZvciBEYXRhIEFuYWx5c2lzXShodHRwczovL2dncGxvdDItYm9vay5vcmcvKQ0KMy4gW0NvbG9ycyBpbiBSXShodHRwOi8vd3d3LnN0YXQuY29sdW1iaWEuZWR1L350emhlbmcvZmlsZXMvUmNvbG9yLnBkZikNCjQuIFvFmmNpxIVnaSBuYSBzdHJvbmllIHd3dy5ycHVicy5jb21dKGh0dHBzOi8vd3d3LnJwdWJzLmNvbS8pDQo1LiBaYmlvcnkgZGFueWNoIG5hIHN0cm9uaWUgW0phcmVkYSBQLiBMYW5kZXJdKGh0dHA6Ly93d3cuamFyZWRsYW5kZXIuY29tL2RhdGEvKSBpDQpbZnVlbGVjb25vbXkuZ292XShodHRwczovL2Z1ZWxlY29ub215Lmdvdi9mZWcvZG93bmxvYWQuc2h0bWwpDQoNCiMgUm96a8WCYWR5IHcgUiAocnlzb3dhbmllIGR5c3RyeWJ1YW50IGkgZ8SZc3RvxZtjaSByb3prxYJhZMOzdywgZHlzdHJ5YnVhbnR5IGVtcGlyeWN6bnljaCAtIHByYWNhIHogZ2dwbG90MikNCg0KV3lrb25haiBuYXN0xJlwdWrEhWNlIHBvbGVjZW5pYToNCg0KMS4gWmUgc3Ryb255IFtEb3dubG9hZCBGdWVsIEVjb25vbXkgRGF0YV0oaHR0cHM6Ly9mdWVsZWNvbm9teS5nb3YvZmVnL2Rvd25sb2FkLnNodG1sKSB6YXBpc3ogcGxpaw0KemUgemJpb3J1IERhdGFzZXRzIGZvciBBbGwgTW9kZWwgWWVhcnMgKDE5ODTigJMyMDIwKSAocGxpayBjc3Ygc2tvbXByZXNvd2FueSkgbmF6d2E6ICoqWmlwcGVkIENTViBGaWxlKiouDQoyLiBXIFIgZ28gcm96cGFrdWouDQozLiBQb2Rjenl0YWogZG9rdW1lbnRhY2rEmSBkbyB0ZWdvIHBsaWt1ICh3IHR5bSBzYW15bSB3aWVyc3p1IGNvIHpiacOzciBkYW55Y2ggbmF6d2E6ICoqRG9jdW1lbnRhdGlvbioqKSANCjQuIFd5YmllcmFteSB6bWllbm5lDQogIC0gY2l0eUUgKGNpdHkgZWxlY3RyaWNpdHkgY29uc3VtcHRpb24gaW4ga3ctaHJzLzEwMCBtaWxlcyksDQogIC0gY2l0eVVGIChFUEEgY2l0eSB1dGlsaXR5IGZhY3RvciAoc2hhcmUgb2YgZWxlY3RyaWNpdHkpIGZvciBQSEVWKSwNCiAgLSBldk1vdG9yIChlbGVjdHJpYyBtb3RvciAoa3ctaHJzKSksDQogIC0gaGlnaHdheUUgKGhpZ2h3YXkgZWxlY3RyaWNpdHkgY29uc3VtcHRpb24gaW4ga3ctaHJzLzEwMCBtaWxlcykuDQo1LiBXeWR6aWVsIHplIHpiaW9ydSBkYW55Y2ggcG9kemJpw7NyIGF1dCB1xbx5d2FqxIVjeWNoIHBhbGl3YSB0eXB1OiBlbGVjdHJpY2l0eSAob3BlcmFjasSFIGZpbHRyb3dhbmlhIHBvIG5pZXplcm93eWNoIG9ic2Vyd2FjamFjaCBkb3R5Y3rEhWN5Y2ggbnAuIGV2TW90b3IpLg0KNi4gV3lrb25haiBuYSBwb2R6YmlvemUgcG9kc3Vtb3dhbmlhIGRvdHljesSFY2Uga2HFvGRlaiB6ZSB6bWllbm55Y2ggbGljemJvd3ljaCAoxZtyZWRuaWEsIHdhcmlhbmFjamEsIG9kY2h5bGVuaWUgc3RhbmRhcmRvd2UgbWluLCBtYXggaXRwKS4NCjcuIERsYSBrYcW8ZGVqIHptaWVubmVqIGxpY3pib3dlaiB3eWtvbnVqIHcgKipnZ3Bsb3QyKiogcnlzdW5raToNCiAgLSBkeXN5dHJ5YnVhbnR5IGVtcGlyeWN6bmVqIHdhcnN0YXdhICoqc3RhdF9lY2RmKiosDQogIC0gd3lrcmVzdSBwdWRlxYJrby13xIVzeSwgaGlzdG9ncmFtdSwgZ8SZc3RvxZtjaS4NCjguIFVzdGFsIHppYXJubyBnZW5lcmF0b3JhIGxpY3piIHBzZXVkb2xvc293eWNoIHBvbGVjZW5pZW0gKipzZXQuc2VlZCgxOTAzMjAyMCkqKg0KOS4gS29yenlzdGFqxIVjIHogZ2VuZXJhdG9yw7NXIGxpY3piIHBzZXVkb2xvc293eWNoIHJvemvFgmFkw7N3IG5vcm1hbG5lZ28gaSBiZXRhICgqKnJub3JtKiogaSAqKnJiZXRhKiopLCBkbGEgZHfDs2NoIHBhciByw7PFvG55Y2ggcGFyYW1ldHLDs1cgZGxhIGthxbxkZWdvIHogbmljaCwgd3lnZW5lcnVqIHBvIDIwMCBsaWN6YiBwc3VlZG9sb3Nvd3ljaC4gTWFzeiBtaWXEhyA0IGNpxIVnaSBsaWN6Yi4NCjEwLiBOYXJ5c3VqIGRsYSBuaWNoIGhpc3RvZ3JhbXkgaSBkeXN0cnlidWFudMSZIGVtaXJ5Y3puxIUuDQoxMS4gUHJ6ZcWbbGkgc2tyeXAgKipSKiogZG8gZG5pYSAyNSBtYXJjYSBici4NCg0KVyByYXppZSBweXRhxYQgcG9yc3rEmSBvIGtvbnRhayBlLW1haWxvd3kuDQoNCiMgUHJhY2EgZG9tb3dhIHogZG5pYSAxOSBtYXJjYSAyMDIwci4gKGRvIGxhYm9yYXRvcml1bSkNCg0KMS4gUHJvc3rEmSB3eWdlbmVyb3dhxIcgcHJ6eSBwb21vY3kgY28gbmFqbW5pZWogOCByw7PFvG55Y2ggZ2VuZXJhdG9yw7N3IGxpY3piIHBzZXVkb2xvc293eWNoIChyw7PFvG5lIHJvemvFgmFkeSBwcmF3ZG9wb2RvYmllxYRzdHdhKSBjacSFZ2kgMjAwIGxpY3piIHBzZXVkb2xvc293eWNoLiBQcm9zesSZIHVzdGF3acSHIHppYXJubyBnZW5lcmF0b3JhIGxpY3pixIUgcHN1ZG9sb3Nvd3ljaCBuYSAqKjE5MDMyMDIwKiouDQoyLiBEbGEgd3lsb3Nvd2FueWNoIGNpxIVnw7N3IHByb3N6xJkgbmFyeXNvd2HEhyBoaXN0b2dyYW15IGkgZHlzdHJ5YnVhbnR5IGVtcGlyeWN6bmUuDQozLiBQcm9zesSZIG5hcnlzb3dhxIcgd3lrcmVzeSBnxJlzdG/Fm2NpIGkgZHlzdHJ5YnVhbnQgY28gbmFqbW5pZWogNiByb3prxYJhZMOzdyBwcmF3ZG9wb2RvYmllxYRzdHdhIHByemVkc3Rhd2lhbnljaCBuYSB3eWvFgmFkemllIChkbGEga2HFvGRlZ28geiA1IHdhcmlhbnRhbWkgcGFyYW1ldHLDs3cpLiA8c3BhbiBzdHlsZT0iY29sb3I6IHJlZCI+IA0KR8SZc3RvxZtjaSAob2Rwb3dpZWRuaW8gZHlzdHJ5YnVhbnR5KSBkbGEgZGFuZWdvIHR5cHUgcm96a8WCYWR1IG1hasSFIGJ5xIcgdW1pZXN6Y3pvbmUgbmEgamVkbnltIHJ5c3Vua3UuPC9zcGFuPg0KNC4gUHJvc3rEmSBuYXJ5c293YcSHIHBvZHN0YXdvd2Ugc3RhdHlzdHlraSBncmFmaWN6bmUgZGxhIHd5YnJhbnljaCBkd8OzY2ggem1pZW5ueWNoIGN6eW5uaWtvd3ljaCBpIGR3w7NjaCBjacSFZ8WCeWNoIChkeXNrcmV0bnljaCB6IGR1xbzEhSBpbG/Fm2NpxIUgb2JzZXJ3YWNqaSkgeiBqZWRuZWdvIHplIHpiaW9ydSBhY3NfbnkuY3N2IGx1YiBhY3NOZXcuY3N2Lg0KPHNwYW4gc3R5bGU9ImNvbG9yOiByZWQiPiBEYW5lIHPEhSBkb3N0xJlwbmUgbmEgc3Ryb25pZSBKYXJlZGEgUC4gTGFuZGVyYSAodyBza3J5cGNpZSB6YmnDs3IgbmFsZcW8eSBwb2JyYcSHLCBvZHBvd2llZG5pbyB6bW9keWZpa293YcSHIGRhbmUgaSBkb3BpZXJvIHd0ZWR5IG1vxbxuYSByeXNvd2HEhykuIDwvc3Bhbj4NCjxzcGFuIHN0eWxlID0gImNvbG9yOiByZWQiPiA8Y2VudGVyPlRlcm1pbiBwcnplc8WCYW5pYSAyIGt3aWV0bmlhIGJyLjwvY2VudGVyPiA8L3NwYW4+DQo1LiBQcm9zesSZIHNpxJkgemFwb3puYcSHIG5hIG5hc3TEmXBuZSBsYWJvcmF0b3JpYSB6ZSBzcG9zb2JhbWkgbGljemVuaWEgcHJ6ZWR6aWHFgsOzdyB1Zm5vxZtjaSBbQmlibGlvdGVrIHJjb21wYW5pb25dKGh0dHBzOi8vcmNvbXBhbmlvbi5vcmcvaGFuZGJvb2svQ18wMy5odG1sKSwgWzkuIENhbGN1bGF0aW5nIENvbmZpZGVuY2UgSW50ZXJ2YWxzXShodHRwczovL3d3dy5jeWNsaXNtby5vcmcvdHV0b3JpYWwvUi9jb25maWRlbmNlLmh0bWwpIGkgW0hvdyB0byBDYWxjdWxhdGUgQ29uZmlkZW5jZSBJbnRlcnZhbCBpbiBSP10oaHR0cHM6Ly9kYXRhc2hhcmtpZS5jb20vaG93LXRvLWNhbGN1bGF0ZS1jb25maWRlbmNlLWludGVydmFsLWluLXIvKS4NCg0KIDxjZW50ZXI+PGgyPjxzcGFuIHN0eWxlID0gImNvbG9yOiByZWQiPlV3YWdhLjwvc3Bhbj48L2gyPjwvY2VudGVyPiA8aDM+TmF6d2EgcGxpa3UgaSB0eXR1xYIgZS1tYWlsYSB6ZSBza3J5cHRlbSB6IGxhYm9yYXRvcml1bSBpIHogcHJhY8SFIGRvbW93xIUgcG93aW5pZW55IGJ5xIcgemdvZG55IHplIG5hc3TEmXB1asSFY3ltIHNjaGVtYXRlbSAqKk51bWVyQWxidW11X05hendpc2tvX1BEeHgqKiBsdWIgKipOdW1lckFsYnVtdV9OYXp3aXNrb19MYWJ4eCoqLCBnZHppZSB4eCBvbmFjemEgbnVtZXIgcHJhY3kgZG9tb3dlaiBsdWIgemFqxJnEhyBsYWJvcmF0b3JpdW0uIFByYWPEmSBkb21vd8SFIGkgc2tyeXB0IHogbGFib3JhdG9yaXVtIHd5c3nFgmFqxIUgUGHFhHN0d28gb2RkemllbG5pZSE8L2gzPi4NCg0K