[2ページ] SREの人気記事 1136件 - はてなブックマーク

41 - 80 件けん / 1136件けん

新着しんちゃく順じゅん人気にんき順じゅん

絞しぼり込こみ

検索けんさく対象たいしょう
ブックマーク数すう
期間きかん
セーフサーチ

SREの検索けんさく結果けっか41 - 80 件けん / 1136件けん

「運用うんよう組織そしき」の考かんがえ方かたと設計せっけい〜運用うんよう組織そしき論ろん 2021 / 20210310-ssmjp-operation-organization
- 372 users
- speakerdeck.com/opelab
- テクノロジー
- 2021/03/11
ssmjp ssmonline #8 "第だい三さん回かいはたのさん祭さいオンライン"( https://ssmjp.connpass.com/event/206074/ )での発表はっぴょう資料しりょうです。 (運用うんよう設計せっけいラボ合同ごうどう会社かいしゃ波田野はたの裕一ひろいち)
AWSコスト削減さくげんとリソース管理かんり | 外道げどう父ちちの匠たくみ
- 371 users
- blog.father.gedow.net
- テクノロジー
- 2023/08/24
クラウド使づかいなエンジニアの皆様みなさま、猛暑もうしょと円えん安やすの中ちゅういかがお過すごしですか。上層じょうそう部ぶからインフラコスト削減さくげんを突つきつけられてはおりませんでしょうか。今回こんかいはおそらく初はじめてコスト削減さくげんについてAWSを軸じくに書かいていきますが、考かんがえ方かたはどこの環境かんきょうでも似にたりよったりなので何なにかしらの足たしになればと思おもう次第しだいであります。目次もくじ長ながいです。ひきかえしたほうがいいぞ！コミュニティに捧ささげます AWSの売上うりあげコスト削減さくげんとは三さん大だい使命しめいコスト状況じょうきょう整理せいり Load Balancer 参考さんこうリンク統合とうごうによる削減さくげん EC2 Autoscaling 参考さんこうリンク情報じょうほう整理せいり古ふるいインスタンスタイプの変更へんこうスケジュールの調整ちょうせいスポットインスタンスの適用てきよう軽量けいりょうインスタンスの統合とうごう・サーバーレス化かアプリケーション処理しょりの軽減けいげん EC2 EBS EBSは高たかい不要ふようEBSを削除さくじょ・スナップショット化かボリュームタイプの変更へんこう EC2 AMI NAT Gatew
【翻訳ほんやく記事きじ】デプロイ戦略せんりゃくの定義ていぎ - そこに仁義じんぎはあるのか(仮かり)
- 370 users
- syobochim.hatenablog.com
- テクノロジー
- 2020/03/18
この記事きじは2017/11の以下いかのブログ記事きじの翻訳ほんやくです。 blog.itaysk.com まずはじめに、翻訳ほんやくを快こころよく許可きょかしていただいた@itayskさんに感謝かんしゃいたします。 3年ねん前まえの記事きじですが、デプロイ戦略せんりゃくについてここまで網羅もうら的てきにまとめられた記事きじが日本語にほんごで見みつけられなかったので翻訳ほんやくしてみようと思おもいました。初はじめての翻訳ほんやく記事きじであり、かつ翻訳ほんやく時じに多少たしょうの意訳いやくを含ふくんでいます。私わたしの翻訳ほんやくミスがある可能かのう性せいも十分じゅうぶんにご了承りょうしょうください。何なにか間違まちがいやわかりにくいところがあれば、コメントいただけますと幸さいわいです。無謀むぼうなデプロイ (Reckless Deployment) ローリングアップグレード (Rolling Upgrade) ヘルスチェックと監かん視しロールバック後方こうほう互換ごかん性せいちなみにブルーグリーンデプロイ (Blue/Green Deployment) ドレインスイッチバックステージちなみにカナリアデプロ
社内しゃない用ようGitHub Actionsのセキュリティガイドラインを公開こうかいします | メルカリエンジニアリング
- 367 users
- engineering.mercari.com
- テクノロジー
- 2023/06/09
この記事きじは、Merpay Tech Openness Month 2023 の4日にち目めの記事きじです。こんにちは。メルコインのバックエンドエンジニアの@goroです。はじめにこのGitHub Actionsのセキュリティガイドラインは、社内しゃないでGithub Actionsの利用りように先駆さきがけ、社内しゃない有志ゆうしによって検討けんとうされました。「GitHub Actionsを使つかうにあたりどういった点てんに留意りゅういすれば最低限さいていげんの安全あんぜん性せいを確保かくほできるか学習がくしゅうしてもらいたい」「定期ていき的てきに本ほんドキュメントを見返みかえしてもらい自分じぶんたちのリポジトリーが安全あんぜんな状態じょうたいになっているか点検てんけんする際さいに役立やくだててもらいたい」という思おもいに基もとづいて作成さくせいされています。今回こんかいはそんなガイドラインの一部いちぶを、社外しゃがいの方々かたがたにも役立やくだつと思おもい公開こうかいすることにしました。ガイドラインにおける目標もくひょうこのガイドラインは事前じぜんに2段階だんかいの目標もくひょうを設定せっていして作成さくせいされています。まず第だい1に「常つねに達成たっせいしたいこと
- github
- security
- GitHub Actions
- ci
- あとで読よむ
- セキュリティ
- actions
- SRE
- guideline
- github-actions

コンテナ研修けんしゅう（Kubernetes編へん）【MIXI 23新卒しんそつ技術ぎじゅつ研修けんしゅう】
- 360 users
- speakerdeck.com/mixi_engineers
- テクノロジー
- 2023/05/13
23新卒しんそつ技術ぎじゅつ研修けんしゅうで実施じっししコンテナ研修けんしゅう（Kubernetes編へん）の講義こうぎ資料しりょうです。動画どうが：https://youtu.be/Dk0isJQ6a80 こちらは後編こうへんになります。前編ぜんぺんはこちら：https://speakerdeck.com/mixi_engineers/2023-container-t…
SadServers - Linux & DevOps Troubleshooting Interviews
- 359 users
- sadservers.com
- テクノロジー
- 2022/10/27
"Like LeetCode for Linux" Capture The Flag challenges. Train and prove your debugging skills. Practice for your next SRE/DevOps interview. Get a full remote Linux server with a problem and fix it.
ネットワークが劣悪れつあくな環境かんきょうを再現さいげんする方法ほうほう
- 352 users
- zenn.dev/headwaters
- テクノロジー
- 2024/03/10
目的もくてきアプリケーションが通信つうしんに失敗しっぱいした際さいのテストを行おこないたい例れい. 「通信つうしんに失敗しっぱいした場合ばあいに再さい取得しゅとくボタンが表示ひょうじされること」など方法ほうほう1. Chrome DevTools を使つかう https://developer.chrome.com/docs/devtools/network/reference?hl=ja#throttling 任意にんいの設定せっていを追加ついかして使用しようすることができるメリット PCとモバイルデバイスの両方りょうほうで使用しよう可能かのう新規しんきにアプリケーションをインストールする必要ひつようが無ないデメリットパケロス率りつなどを設定せっていできない Android, iOS のネイティブアプリでは使用しようできない方法ほうほう2. Network Link Conditioner を使用しようする Network Link Conditioner は Apple が提供ていきょうしているネットワークユーティリティツール使用しよう手順てじゅん等とうは以下いかのサイトが分わかりやす
https://twitter.com/matsuu/status/1586362867506327552
- 351 users
- twitter.com/matsuu
- テクノロジー
- 2022/10/30
- インフラ
- あとで読よむ
- エンジニア
- LeetCode
- SRE
- network
- サーバ
- linux
【衝撃しょうげき】AWSのRDSがデータを失うしなわないBlue/Greenデプロイに対応たいおうしました #reinvent | DevelopersIO
- 350 users
- dev.classmethod.jp
- テクノロジー
- 2022/11/28
「最近さいきんは、データベースもB/Gデプロイできるらしいよ？」「そりゃそうやろ。B/Gデプロイなんて、最近さいきん当あたり前まえ………　へ？DBが？無理むりでしょ？ほぇ？どういうこと？」最初さいしょアップデートのタイトルを見みたときの、ハマコーの率直そっちょくな感想かんそうです。 Blue/Greenデプロイは、現行げんこうバージョンのトラフィックを活いかしたまま新しんバージョンを動作どうさ確認かくにんし、問題もんだいなければ新しんバージョンをリリースするという、最近さいきんの安全あんぜんなデプロイの概念がいねんにおいて無なくてはならないものです。同時どうじに新旧しんきゅうバージョンを稼働かどうさせるため、基本きほん的てきにはステートレスなアプリケーション・サーバーにおいて利用りようするものという固定こてい概念がいねんがあったのですが、それをデータベースに対たいして既存きそんのAWSの技術ぎじゅつを組くみ合あわせつつAWSらしいマネージドな仕組しくみで解決かいけつしようという、意欲いよく的てきなリリースです。制約せいやく事項じこうもそれなりにあるので、皆みなさんの運用うんようワークロードに当あてはまるかは、事前じぜんの検証けんしょうが必
SREやクラウドエンジニアが読よむと良よさげな本ほんまとめ - Qiita
- 347 users
- qiita.com/tmknom
- テクノロジー
- 2019/12/09
一いち年ねん半はんぐらい前まえにアプリケーションエンジニアからSREにコンバートした筆者ひっしゃが、いま役やくに立たってるなぁっていう本ほんを紹介しょうかいします。アプリケーションコードを書かいてるときは下したのレイヤの技術ぎじゅつに興味きょうみなかったんですが、改あらためて勉強べんきょうしてみると楽たのしいです。コンピュータシステムクラウド全盛ぜんせいとはいえ、コンピュータの仕組しくみはおさえておくと役立やくだちます。コレ系けいの本ほんはわりと小しょう難むずかしいものが多おおいですが、個人こじん的てきに楽たのしく読よめた本ほんを紹介しょうかいします。 Raspberry Piで学まなぶコンピュータアーキテクチャ Raspberry Piと銘打めいうたれてますが、コンピュータアーキテクチャの歴史れきし的てきな背景はいけいも踏ふまえて解説かいせつされています。プロセッサ・メモリ・ストレージ・ネットワーク・OS・プログラミングなど、コンピュータ単体たんたいの基本きほん的てきな知識ちしきを学まなべます。　歴史れきしをあわせて知しることができるため、知的ちてき好奇心こうきしんがおおいに刺激しげきされ、楽たのしく読よむことができます。この本ほんが難むずかしく感かんじ
Treasure Data を退職たいしょくしました - k0kubun's blog
- 346 users
- k0kubun.hatenablog.com
- テクノロジー
- 2022/07/25
約やく5年ねん5か月げつ働はたらいたTreasure Dataを7/22に退職たいしょくした。7/25からShopifyに入社にゅうしゃし、RustでJITコンパイラを開発かいはつしてRubyを高速こうそく化かする仕事しごとをする。仕事しごととしてやりたい分野ぶんやが変かわってきて自分じぶんは今回こんかい転職てんしょくしたけど、とても良よい会社かいしゃなので、この記事きじがTreasure Data (以下いかTD) で働はたらくことに興味きょうみがある人ひとの参考さんこうになれば良よいと思おもっている。*1 5年ねん勤続きんぞく記念きねんにいただいたトロフィーやっていたこと APIチーム元々もともとTDにはJavaで分散ぶんさんシステムを書かきたくて入社にゅうしゃしたのだが、TD入社にゅうしゃ前まえに特とくにそういう経験けいけんがあるわけでもなく主おもにRailsをやっていたこともあり、Railsでプラットフォームを開発かいはつするチームに入はいった。基盤きばん開発かいはつをやりたいと思おもいながらサービス開発かいはつ者しゃとして最初さいしょ働はたらき、後のちに基盤きばん開発かいはつチームにジョインするみたいな過去かこの経験けいけんがあったので、今回こんかいもそういう感かんじでいけると考かんがえていた。実み
Webサービスの障害しょうがい対応たいおうのときの思考しこう過程かてい - ぱいぱいにっき
- 343 users
- mackee.hatenablog.com
- テクノロジー
- 2020/08/30
起おこってほしくはないのですが、あらゆるWebサービスは完璧かんぺきに動作どうさする状態じょうたいを維持いじすることは難むずかしく、やはり障害しょうがい対応たいおう・トラブルシューティングといった作業さぎょうが発生はっせいします。筆者ひっしゃは普段ふだん仕事しごとで障害しょうがい対応たいおうを不幸ふこうなことによくやるのですが、障害しょうがい対応たいおうのスキルというのはスピードや判断はんだんの正確せいかくさが求もとめられるせいか、今いままでやったことがある人ひと・ノウハウがある人ひとに集中しゅうちゅうし、それ以外いがいの人ひとは眺ながめるだけ・あとからログを見返みかえすだけの状態じょうたいによく陥おちいることがあります。これはWebサービスを開発かいはつ・運用うんようするチームとしてみたときにそういった苦労くろうが特定とくていの人ひとに集中しゅうちゅうするのは良よくないので、それを緩和かんわする目的もくてきとして、筆者ひっしゃが障害しょうがい対応たいおう時じに考かんがえていることを記述きじゅつしてみます。なお、これが唯一ゆいいつの正解せいかいではないとは思おもっているので、ツッコミや、自分じぶんはこう考かんがえているよというのを教おしえていただければ幸さいわいです。具体ぐたい的てきな手法しゅほうを避さけて思考しこうの方法ほうほうを述のべているのは、障害しょうがいというのはパター
CIOpsとGitOpsの話はなし - inductor's blog
- 340 users
- blog.inductor.me
- テクノロジー
- 2021/09/24
はじめに GitOpsという言葉ことばが生うまれたのが自分じぶんの知しる限かぎり2017年ねん頃ごろなのですが、世よの中なかにあるCI/CDの仕組しくみはまだほとんどがCIOpsもしくは手動しゅどうのオペレーションによって成なり立たっていると思おもっていて、かつては自分じぶんもそうだったのですが「Gitで管理かんりされていればGitOpsなんでしょ？」という勘違かんちがいを払拭ふっしょくしたくてこのエントリーを書かいています。 GitOpsとCIOpsは全然ぜんぜん違ちがうまず前提ぜんていとしてGitOpsの明確めいかくな定義ていぎを知しらないという場合ばあい、あなたの思おもう「Gitを契機けいきとした自動じどうデプロイの仕組しくみ」は基本きほん的てきにはCIOpsです。GitOpsとCIOpsは思おもったよりも大おおきな違ちがいがあって、そもそもGitOpsの必要ひつよう性せいが分わかっていない場合ばあい、自動じどう化かによって成立せいりつしているデプロイはCIOpsが基本きほんです。 CIOpsとGitOpsの一番いちばんの違ちがいは、Push型がたかPull型がたかである CIOpsの場合ばあい、例たとえばGitHub
- ci
- git
- あとで読よむ
- DevOps
- GitOps
- SRE
- 開発かいはつ
- デプロイ
- development
- インフラ
入門にゅうもん監視かんしやSRE本ほんに学まなぶ障害しょうがい対応たいおうフォーメーション - An Epicurean
- 338 users
- blog.song.mu
- テクノロジー
- 2021/12/02
システム障害しょうがいが起おこったときにどういう体制たいせいで望のぞむか、エンジニア個人こじんが障害しょうがいに直面ちょくめんした時ときにどのような役割やくわりを受うけ持もつのが良よいのか。組織そしきによって色々いろいろなパターンはあるでしょう。しかし、幸さいわいにも「入門にゅうもん監視かんし」やSRE本ほんに書かかれている4つの役割やくわり分担ぶんたんが浸透しんとうしているので、それをベースに考かんがえるのがファーストステップとしては良よいのではないでしょうか。入門にゅうもん監視かんし ―モダンなモニタリングのためのデザインパターン作者さくしゃ:Mike Julianオライリー・ジャパンAmazon SRE サイトリライアビリティエンジニアリング ―Googleの信頼しんらい性せいを支ささえるエンジニアリングチームオライリージャパンAmazon ただ、小ちいさな組織そしきでは障害しょうがい時じに4人にんもすぐに揃そろわない場合ばあいもあるでしょうし、そもそも4人にんもスタッフがいない、と言いう場合ばあいもあるでしょう。そういった場合ばあいにもどうすればいいのか考かんがえていきます。役割やくわり分担ぶんたんの基本きほん「入門にゅうもん監視かんし」に
AWSの開発かいはつ環境かんきょうの利用りよう時間じかんをGoogleカレンダー連動れんどうさせたら開発かいはつチームが自由じゆうに使つかえてコスト70%削減さくげん！！ - Uzabase for Engineers
- 329 users
- tech.uzabase.com
- テクノロジー
- 2023/02/21
こんにちはNewsPicks SREチームの美濃部みのべです。 NewsPicksのSREのミッションの1つに「コストを適正てきせい化かする」というものがあります。サービスの規模きぼ拡大かくだいに比例ひれいしてインフラコストが増ふえないようにし、売上うりあげに対たいするコストの割合わりあいを低ひくく維持いじしていくのがミッションになります。今回こんかいはこのミッションに対たいするアクションとして開発かいはつ環境かんきょうのインフラコストを適正てきせい化かした話はなしをします。 NewsPicksの開発かいはつ環境かんきょうについて開発かいはつ環境かんきょうのコストをどうやって適正てきせい化かしたか稼働かどう時間じかん対応たいおうを実現じつげんする仕組しくみについて実際じっさいどれくらい削減さくげんできたのかまとめ NewsPicksの開発かいはつ環境かんきょうについてまず、NewsPicksの開発かいはつ環境かんきょうについて概要がいようを説明せつめいします。インフラ基盤きばんは本番ほんばん環境かんきょうと同様どうようにAWSを利用りようしており開発かいはつチームは現在げんざい10以上いじょうのチームが存在そんざいし、それぞれのチーム専用せんように用意よういされた開発かいはつ環境かんきょうを利用りようしています。 2年ねん程ほど前まえまでは開発かいはつ
運用うんように携たずさわる人ひと全員ぜんいんに見みてほしい！ Ops Guidesの紹介しょうかい - Qiita
- 319 users
- qiita.com/jacopen
- テクノロジー
- 2023/12/08
PagerDuty Advent Calendarの8日にち目め！今日きょうはOps Guidesのお話はなしです。うちはこうだけど、他たはどうやってるんだろう？普段ふだんから運用うんように関かかわっていると、ふとした瞬間しゅんかんに「そういえば他たの会社かいしゃではどういう運用うんようをやっているんだろう？」と気きになること、ありませんか？そのきっかけは「本当ほんとうになんとなく」といったものから「上手うまくいかない運用うんようにフラストレーションが溜たまって」というどす黒ぐろいものまで色々いろいろあると思おもいますが、いずれにせよ「他たの会社かいしゃの良よいところを取とり入いれて、自分じぶんたちの運用うんようを改善かいぜんしたい」という気持きもちから来きているのは間違まちがいないでしょう。だからこそ、いろんなミートアップに参加さんかして発表はっぴょうを聞きいたり、懇親こんしん会かいで話はなしてみたり、Xに垂しだれ流ながされているいろんなポストを読よんで事例じれいを学まなぶわけです。ベストプラクティスを学まなびたい! このような取とり組くみはとても良よいことですし、是非ぜひとも継続けいぞくして情報じょうほう収集しゅうしゅうし
「もうさばき切きれない」アクセスが激増げきぞうしたECプラットフォームにおける負荷ふか対策たいさく - BASEプロダクトチームブログ
- 319 users
- devblog.thebase.in
- テクノロジー
- 2020/08/27
はじめに CTOの川口かわぐち (id:dmnlk) です。 5月にオンラインmeetupをさせて頂いただきその中なかで「具体ぐたい的てきな負荷ふか対策たいさくに関かんしては開発かいはつブログで！」と言いっていた件けんですが気きづいたらもう9月がつになりかけていました。コロナ禍かにおいてネットショップ作成さくせいサービス「BASE」の利用りよう者しゃ様さまが急増きゅうぞうしました。 www.nikkei.com 5 月がつには 100 万まんショップを超こえるショップオーナー様さまにご利用りようしていただいております。今いままで EC 事業じぎょうを行おこなっていなかった飲食いんしょく店てん様さまや様々さまざまな業種ぎょうしゅの方ほうが利用りようをはじめていただき、ショップオーナー様さまも購入こうにゅう者しゃ様さま共どもに短期たんきの見通みとおしでは想定そうていをしていないアクセスが発生はっせいしました。その途中とちゅうでシステムとして対応たいおうしきれない面めんもあり、アクセス負荷ふかによるサービスの不安定ふあんていを招まねき皆様みなさまにはご不便ふべんや販売はんばい時間じかんを変更へんこうしていただくお願ねがいなどをしてしまい大変たいへん申もうし訳わけありませんでした。現在げんざいでは安定あんていしておりますが、その
次世代じせだいの監視かんし技術ぎじゅつ - Telemetry技術ぎじゅつのご紹介しょうかい - NTT Communications Engineers' Blog
- 311 users
- engineers.ntt.com
- テクノロジー
- 2021/09/03
こんにちは、イノベーションセンターの三島みしまです。本ほん記事きじでは、次世代じせだいの監視かんし技術ぎじゅつとして期待きたいされるTelemetry技術ぎじゅつについてご紹介しょうかいします。この記事きじについて本ほん記事きじでは下記かきの3点てんを共有きょうゆうします。従来じゅうらいの監視かんし技術ぎじゅつが抱かかえる課題かだいとTelemetryの可能かのう性せい Telemetryの技術ぎじゅつ概要がいようと、各社かくしゃの実装じっそう状じょう況きょう NTT Comのネットワーク上じょうで検証けんしょうし得えられた知見ちけんと、期待きたいされるユースケース従来じゅうらいの監視かんし技術ぎじゅつが抱かかえる課題かだいネットワーク運用うんようにおいては、障害しょうがい検知けんちやパフォーマンス分析ぶんせきのため監視かんし技術ぎじゅつが重要じゅうようとなります。従来じゅうらいのネットワークでは、SNMP（Simple Network Management Protocol）と呼よばれる技術ぎじゅつが広ひろく利用りようされています。 SNMPの仕組しくみを図ず1に示しめします。SNMPはUDPベースなネットワーク監視かんし技術ぎじゅつです。データモデルはMIB（Management Information Base）と
障害しょうがい対応たいおうプロセスを改善かいぜんしてきた話はなし - 10X Product Blog
- 308 users
- product.10x.co.jp
- テクノロジー
- 2023/06/12
障害しょうがいプロセスを改善かいぜんしてきた話はなしこんにちは。Reliability & Securityチームに所属しょぞくするSoftware Engineerの@sota1235です。今回こんかいは10X内ないにおける障害しょうがい対応たいおうプロセスの改善かいぜんをご紹介しょうかいします。今いまが完成かんせい系けいではなく道みち半なかばではありますがこの半年はんとし ~ 1年ねんで大おおきく進化しんかしたので同おなじくらいのフェーズの会社かいしゃで困こまってる方ほうがいたら参考さんこうにしてみてください！ちなみに私ささめごとですが去年きょねんの5/26にこんな投稿とうこうをしてたのでやっと伏線ふくせんを回収かいしゅうする形かたちとなります(※ ドヤ顔がおではありません)。目次もくじこんな感かんじで紹介しょうかいしていきます。目次もくじ障害しょうがい対応たいおうプロセスの改善かいぜんに踏ふみ切きった背景はいけい課題かだい1. 障害しょうがいの報告ほうこくフォーマットが統一とういつされていない課題かだい2. 障害しょうがい報ほうのクオリティの差異さいが大おおきく後のちから振ふり返がえりが難むずかしい課題かだい3. 障害しょうがい対応たいおう者しゃが特定とくていの人ひとに偏かたよる第だい一いちの改善かいぜん改善かいぜん1. 障害しょうがい報告ほうこく書しょのフォーマット更新こうしん改善かいぜん2. S
Googleのソフトウェアエンジニアリング - 技術ぎじゅつメモ
- 301 users
- scrapbox.io/razokulover-tech-memo
- テクノロジー
- 2023/07/30
600ページ以上いじょうあり結構けっこう長ながいので方針ほうしんとしては第だい１部ぶだけは一いち通とおり読よんでみて、その先さきは各かく章しょう結論けつろんから読よんでいき、気きになった部分ぶぶんだけ遡さかのぼって拾ひろい読よみしていく戦略せんりゃくでいく方ほうが良よさそう。
『読書どくしょとは、能力のうりょく、知識ちしきではなく問といを獲得かくとくするための行為こうい』みたいな内容ないようで登壇とうだんしました。 - じゃあ、おうちで学まなべる
- 300 users
- syu-m-5151.hatenablog.com
- 学まなび
- 2024/03/13
問題もんだいを解決かいけつする能力のうりょくは確たしかに重要じゅうようですが、それ以上いじょうに、何なにが本当ほんとうに重要じゅうような問題もんだいなのかを見極みきわめ、それを明確めいかくに設定せっていする能力のうりょくが不可欠ふかけつです。問といを適切てきせつに定義ていぎできなければ、どんなに高度こうどな解決かいけつ技術ぎじゅつを持もっていても、その力ちからは十分じゅうぶんに発揮はっきされません。また、誰だれにとって適切てきせつな問といなのかも考かんがえる必要ひつようがあります。問題もんだい解決かいけつの過程かていにおいて、問題もんだいそのものの本質ほんしつを正確せいかくに把握はあくし、適切てきせつな問といを立たてることは重要じゅうようです。イシューからはじめよ――知的ちてき生産せいさんの「シンプルな本質ほんしつ」作者さくしゃ:安宅あたか和人かずと英治えいじ出版しゅっぱんAmazon 概要がいよう SREたちの廊下ろうか〜あなたの現場げんばでの悩なやみ、あの本ほんにヒントがあるかも〜にて「書しょを捨すてよ、現場げんばへ出でよう - このSRE本ほんがすごい！2024年ねん LT版ばん」というテーマで登壇とうだんしました。のイベントは2024年ねん1月がつ末まつに注目ちゅうもくを集あつめた『このSRE本ほんがすごい！2024年版ねんばん』をテーマにしたもので、多おおくの参加さんか者しゃとパネルディスカッションのスピーカーであるT
メルカリShops の CI/CD と Pull Request 環境かんきょう | メルカリエンジニアリング
- 300 users
- engineering.mercari.com
- テクノロジー
- 2021/08/17
こんにちは！ソウゾウの Software Engineer の @dragon3 です。連載れんさい：「メルカリShops」プレオープンまでの開発かいはつの裏側うらがわの８日にち目めを担当たんとうさせていただきます。この記事きじでは、メルカリShops 開発かいはつにおいて、日々ひびバリバリに利用りようされている CI/CD 環境かんきょうと Pull Request 毎ごとのデプロイ環境かんきょうについて紹介しょうかいします。 CI/CD 環境かんきょうメルカリShops では、CI/CD （テスト・ビルド・デプロイ）やその他た自動じどう化かのために GitHub Actions を使つかっており、ほとんどのワークフロー・ジョブを Self-hosted runners で実行じっこうしています。 Self-hosted runners は、専用せんようの VPC ネットワーク内ないの GCE インスタンス上じょうで動うごかしており、Managed Instance Group 等とうを使つかい、そのプロビジョニングや起動きどう・停止ていし等とうは
WebRTC配信はいしんシステムをAWSからオンプレミスに切きり替かえている話はなし
- 298 users
- speakerdeck.com/bateleurx
- テクノロジー
- 2021/07/27
2021年ねん7月がつ27日にち DMM meetup #31 での発表はっぴょう内容ないようです
- aws
- WebRTC
- あとで読よむ
- DMM
- システム
- network
- インフラ
- api
- 運用うんよう
- 設計せっけい
システム障害しょうがい対応たいおう演習えんしゅうを実施じっしした話はなし｜NAVITIME_Tech
- 296 users
- note.com/navitime_tech
- テクノロジー
- 2020/07/02
こんにちは、ネコ派はメタラーです。ナビタイムジャパンで地点ちてん検索けんさく基盤きばんの開発かいはつマネジメントを担当たんとうしています。好すきなバンドは Arch Enemy です。システム運用うんように関かかわる人ひとであれば、「システム障害しょうがい」というと耳みみが痛いたい方ほうが多おおいかと思おもいます。システム障害しょうがいは起おこさないに越こしたことはないですが、万まんが一いちシステム障害しょうがいが発生はっせいしたとき、その行動こうどう選択せんたくはサービスの信頼しんらい性せいを大おおきく左右さゆうすることになります。迅速じんそくに復旧ふっきゅうさせることはもちろんですが、適切てきせつな情報じょうほう公開こうかいによってユーザーの不安ふあんを払拭ふっしょくするといったコミュニケーションも重要じゅうようなポイントです。しかし、緊急きんきゅう事態じたいというプレッシャーを受うけながら最適さいてきな行動こうどうを選択せんたくすることは容易よういではありません。私わたしが所属しょぞくしているチームでは、Web API サーバソフトウェアから全文ぜんぶん検索けんさくミドルウェアまで含ふくめた開発かいはつ・運用うんようを行おこなっており、幅広はばひろいトラブル対応たいおうスキルが必要ひつようになります。トラブル対応たいおうのスキルを持もったベテ
SRE導入どうにゅう: システムを安定あんていさせる4000万まん円えんの魔法まほうの壺つぼ - MonotaRO Tech Blog
- 293 users
- tech-blog.monotaro.com
- テクノロジー
- 2022/09/13
こんにちは。鈴木すずきです。ここにシステムを安定あんていさせる4000万まん円えんの魔法まほうの壺つぼがあるとします。あなたなら買かいますか。はじめに SREやればいいのに 4000万まん円えんの魔法まほうの壺つぼなぜモノタロウはSREに取とり組くむのか 10分ふん落おちると数すう百ひゃく万まん円えん、数すう千せん万まん円えんの影響えいきょうが出でる不安定ふあんていなシステムを札束さつたばでしばいたことがある大だい規模きぼ化か・複雑ふくざつ化かが旧来きゅうらいの運用うんよう方法ほうほうを無効むこう化かする SREの導入どうにゅうによる効果こうか会話かいわの中なかに「SLO」が登場とうじょうするようになったシステムの状態じょうたいを深ふかく理解りかいできるようになったオンコールの初動しょどう対応たいおうが早はやく精緻せいちになった SREの難むずかしさ組織そしき横断おうだん的てきな活動かつどうの難むずかしさ安定あんてい的てきに時間じかんを使つかうことの難むずかしさ利用りようするツールやサービスの難むずかしさどのようにSREを導入どうにゅうしたのか Googleの最新さいしんSREを学まなんだ CUJを定義ていぎした SLIとSLOを定義ていぎした Cloud Monitoringでダッシュボードを作成さくせいした役やくに立たつかもしれない話はなし可か
Kubernetesに腰こしを据すえて入門にゅうもんする方かた向むけのロードマップ - Qiita
- 287 users
- qiita.com/riita10069
- テクノロジー
- 2023/02/05
背景はいけい最近さいきん、「コンテナはもうわかってきたので、これからKubernetesについて腰こしを据すえて勉強べんきょうしたいが、どのように勉強べんきょうすればいいかわからない」という相談そうだんをいただくことがすごく多おおくなった。必要ひつように応おうじて必要ひつようなリソースの挙動きょどうなどを調しらべてきたし、僕ぼく自身じしんも知しらないことばかりなので、全すべてを伝つたえることはできない。とはいえ、「入門にゅうもんしにくいサービスが伸のびにくい」というのは、間違まちがいないので、Kubernetesに入門にゅうもんする上じょうでこの順番じゅんばんで学習がくしゅうしたら、基本きほん的てきな内容ないようを身みにつけられるのではないかというロードマップを一ひとつ公開こうかいしておくことで、これから業務ぎょうむでKubernetesを理解りかいしていく必要ひつようがある方ほうの最初さいしょの一いち歩ほを助たすけられるかもしれないと思おもい、公開こうかいする事こととした。(このQiitaのリンクを渡わたすだけで質問しつもんに回答かいとうできるという状態じょうたいを作つくりたいという観点かんてんもある。) 自分じぶんの今いまの、Kubernetesに対たいする理解りかいをうまく表現ひょうげんできてい
Goで実装じっそうされた高速こうそくな 仮想かそう待合室まちあいしつサーバの実装じっそうと詳解しょうかい
- 286 users
- speakerdeck.com/pyama86
- テクノロジー
- 2023/09/14
ペパボのテックカンファレンスで話はなしました。
マルチAWSアカウント環境かんきょうのセキュリティって無理むりゲーじゃね？
- 283 users
- zenn.dev/teradatky
- テクノロジー
- 2024/07/25
対象たいしょう読者どくしゃ様々さまざまなプロダクトへ AWS アカウントや環境かんきょうを提供ていきょうする SRE / CCoE チームを想定そうていしています。マルチAWSアカウント環境かんきょう SRE / CCoE は各かくプロダクトが安全あんぜんかつ便利べんりに AWS を利用りようできるよう、AWS アカウントの設定せってい・払はらい出だしや周辺しゅうへんコンポーネントの提供ていきょう（踏ふみ台だい・ID管理かんり・ログ収集しゅうしゅう etc...）を行おこないます。個別こべつプロダクトの基盤きばん設計せっけいや構築こうちくは行おこないません。私わたしの担当たんとう案件あんけんでは 100 以上いじょうの AWS アカウントを提供ていきょうしています。これでも多おおいとは言いえず、例たとえば NTT ドコモでは 2,000 以上いじょうの AWS アカウントを管理かんり[1]しているそうです。セキュリティ対応たいおう方針ほうしんセキュリティグループの全ぜん開放かいほうや S3 バケットのパブリック公開こうかいなど、AWS リソースの不適切ふてきせつな設定せっていについての対応たいおうを考かんがえます。ゲート型がた IAM ポリシーやサービスコントロールポリシー (SCP) で
【いでよ障害しょうがい対応たいおう太郎たろう】我々われわれはインシデントにどう向むき合あっているのか〜社内しゃない向むけ障害しょうがい対応たいおうリスト付つき〜
- 276 users
- medium.com
- テクノロジー
- 2020/07/21
「なんかアプリでインシデント起おきてエンジニアがどこかで対応たいおうしてるらしいよ」「インシデント時じのお知しらせって誰だれがどうやって出だすんだっけ？」「インシデントの復旧ふっきゅう作業さぎょうって今いまどれくらい終おわってる？」「あのインシデントって振ふり返かえりしたっけ？」「似にたようなインシデント、前まえも対応たいおうしたような、していないような」このような会話かいわに覚おぼえはありませんか？ FiNC Technologies社しゃ (以下いかFiNC) では今いままでインシデント対応たいおうをしていても自じチーム内ないで対処たいしょしようとしてしまい、他たの人ひとが気きづけないインシデント対応たいおうの仕方しかたにフォーマットがなく、迅速じんそくな対応たいおうやお客様きゃくさまへの報告ほうこくができないインシデントの振ふり返がえりが実施じっしされず、インシデント時じの知見ちけんが共有きょうゆうされないという問題もんだいがありました。それらの問題もんだいを気きが付つきやすく、シェアしやすくする = 統一とういつのチャンネルで情報じょうほうを整理せいりし、そこにシェアしやすい空気くうきを作つくる何なにをすべきかわ
SRE 研修けんしゅう
- 276 users
- docs.google.com
- テクノロジー
- 2023/04/15
! コピーして利用りようしてください ! 文責ぶんせき: @chaspy_ (Takeshi Kondo) take.she12@gmail.com twitter: https://twitter.com/chaspy_ 公開こうかい時じの Tweet: https://twitter.com/chaspy_/status/1647190440628883461 お仕事しごと依頼いらい: https://chaspy.me/service/ SRE 研修けんしゅう ! コピーして利用りようしてください ! SRE 研修けんしゅう Day0: 概要がいよう背景はいけい対象たいしょう持もち帰かえれるもの / ゴール扱あつかわないことプログラム参考さんこう資料しりょう Day1: 信頼しんらい性せいを...
なぜ使つかわれないダッシュボードが作つくられるかという話はなし - satoshihirose.log
- 276 users
- satoshihirose.hateblo.jp
- 学まなび
- 2023/06/26
はじめに最近さいきん、ビジネスダッシュボードの設計せっけい・実装じっそうガイドブックという書籍しょせきが出版しゅっぱんされた。今いままであまりなかった視点してんから書かかれたデータに関かんする本ほんで面白おもしろく読よんだ。ビジネスダッシュボード設計せっけい・実装じっそうガイドブック成果せいかを生うみ出だすデータと分析ぶんせきのデザイン作者さくしゃ:トレジャーデータ,池田いけだ俊介しゅんすけ,藤井ふじい温子あつこ,櫻井さくらい将すすむ允まこと,花岡はなおか明あきら翔しょう泳およげ社しゃAmazon 作つくったダッシュボードの利用りようが進すすまず、虚むなしさを覚おぼえた経験けいけんがある人ひとは多おおいと思おもう。どうしてそうなってしまうのか、自分じぶんの経験けいけんを元もとにまとめたいなと思おもったのでまとめる。なぜ使つかわれないダッシュボードが作つくられるかなぜ作つくられたダッシュボードが使つかわれないかと言いうと、基本きほん的てきにはそのダッシュボードがそんなに必要ひつようなものではないからだ（社内しゃない周知しゅうちがうまくない、ツールの使つかい方かたがわからない人ひとが多おおいなどの理由りゆうもあったりするがここでは無視むしする）。必要ひつようのないダッシュボードが作つくられてしまう状況じょうきょうに関かんして
SRE実践じっせんの手引てびき ─ 信頼しんらい性せいをどう制御せいぎょするか？から始はじめる、現実げんじつ的てきな指標しひょうと目標もくひょうの設計せっけいと計測けいそく - エンジニアHub｜Webエンジニアのキャリアを考かんがえる！
- 274 users
- eh-career.com
- テクノロジー
- 2019/12/05
SRE実践じっせんの手引てびき ─ 信頼しんらい性せいをどう制御せいぎょするか？から始はじめる、現実げんじつ的てきな指標しひょうと目標もくひょうの設計せっけいと計測けいそく SREの役割やくわりには、信頼しんらい性せい、SLIとSLO、エラーバジェット、トイル、ソフトウェアエンジニアリングといった複数ふくすうのキーワードが存在そんざいするがゆえ、なかなかうまく実践じっせんできない、という声こえもあります。本稿ほんこうでは、難むずかしく見みられがちなSREの内実ないじつを、「信頼しんらい性せいの制御せいぎょ」というコンセプトを軸じくに整理せいりし、小ちいさく始はじめる一いち歩ほを坪内つぼうち佑たすく樹じゅ（ゆううき）さんが解説かいせつします。こんにちは。SREの研究けんきゅう者しゃをやっているゆううき（@yuuk1t）です。 SRE（Site Reliability Engineering）は、従来じゅうらいのオペレーションエンジニア、システム管理かんり者しゃ（sysadmin）と呼よばれる人々ひとびとが担になっていた技術ぎじゅつ領域りょういきの新あたらしい形かたちです。Googleによって提唱ていしょうされ、日本にっぽん国内こくないでも2015年ねんごろからWebコンテンツ事業じぎょう者しゃのコミュニティを中心ちゅうしんに広ひろく知しられる
オブザーバビリティ研修けんしゅう実践じっせん編へん
- 274 users
- speakerdeck.com/biwashi
- テクノロジー
- 2024/05/22
株式会社かぶしきがいしゃサイバーエージェント AI事業じぎょう本部ほんぶ 2024年度ねんどエンジニア新卒しんそつ研修けんしゅうオブザーバビリティ研修けんしゅう実践じっせん編へん（一部いちぶ社内しゃない向むけの内容ないよう）
カオスエンジニアリングを組織そしきにも適用てきよう。アンチフラジャイルなシステムを目指めざしてユーザベースが発見はっけんした問題もんだいとは？ - はてなニュース
- 272 users
- hatenanews.com
- テクノロジー
- 2021/12/15
Netflixがシステム運用うんように取とり入いれている、カオスエンジニアリング（chaos engineering）という手法しゅほうがあります。例たとえば機能きのうを冗長じょうちょう化かしたシステムでも、いざ障害しょうがいが起おきたときに別べつ系統けいとうが想定そうていどおり機能きのうするか分わからない。そこで実際じっさいに動うごいているシステムで意図いと的てきに障害しょうがいを起おこし、挙動きょどうを確認かくにんしてシステムの改善かいぜんにつなげる考かんがえ方かたです。株式会社かぶしきがいしゃユーザベースでは、アンチフラジャイル（antifragile、反はん脆弱ぜいじゃく）なシステムを目指めざしてカオスエンジニアリングを導入どうにゅうしています。システムだけでなく、エンジニア組織そしきにおいてもカオスエンジニアリングを応用おうようした改善かいぜんプロセスに着手ちゃくしゅしています。キーパーソンがいなくなってもプロジェクトはうまく動うごき続つづけるか、実際じっさいに外はずれてもらって確認かくにんするのです。このチャレンジングな取とり組くみについて、CTOの林はやし尚之なおゆきさんと、システムでも組織そしきでもカオスエンジニアリングを体験たいけんしたエンジニアの
障害しょうがい発生はっせい！全員ぜんいん集合しゅうごう？－オンコールアンチパターンからの一いち歩ほ前進ぜんしん - Cybozu Inside Out | サイボウズエンジニアのブログ
- 271 users
- blog.cybozu.io
- テクノロジー
- 2021/08/19
8月がつだというのに涼すずしい日ひが続つづきますね。 kintone.comのDevOpsをしている@ueokandeです。もうすぐAWS版ばんkintoneのローンチからから2年ねんが経過けいかしようとしています。この2年間ねんかん、DevOpsチームではkintone.comのサービス安定あんてい化かやスケーラビリティに注力ちゅうりょくしてきました。時ときには本番ほんばん環境かんきょうの障害しょうがいで休日きゅうじつや深夜しんやに障害しょうがい対応たいおうすることもあります。 kintone.comの障害しょうがいの一いち次じ対応たいおうは、我々われわれDevOpsメンバーが実施じっししています。サービスローンチ直後ちょくごは、メンバーの多おおくがオンコールに不慣ふなれで、慌あわてて障害しょうがい対応たいおうしたりうまく進すすめられないことが何なん度どもありました。そこでメンバー全員ぜんいんが効率こうりつ的てき・効果こうか的てきな障害しょうがい対応たいおうを目指めざすべく、チームでPagerDuty社しゃのIncident Response（非公式ひこうしき日本語にほんご訳やく版ばん）を読よむことにしました。この記事きじではAWS版ばんkintoneで実際じっさいに体験たいけんした障害しょうがい
筋肉きんにくマージは辞やめよう - Qiita
- 270 users
- qiita.com/potyamaaaa
- テクノロジー
- 2019/12/04
追記ついき2 2019/12/04 21:00 こんなよくわからない記事きじをご覧らんいただきありがとうございます。この事件じけんを起おこしたのは1年ねん前まえで、Gitを使つかいはじめて1ヶ月かげつのときに下記かきの事件じけんを起おこしてしまっていてとても混乱こんらんしていたのを当時とうじ覚おぼえています。内容ないようについては、rmをしたかもしれないという記事きじに結果けっか的てきになったかもしれませんが、私わたしの記憶きおくではファイルを消けした記憶きおくはありません。ただ、当時とうじ作業さぎょうしていたディレクトリもないのでコマンドを確認かくにんする手段しゅだんがないため一番いちばん濃厚のうこうなrmをしたというのを今回こんかいの結論けつろんにしました。曖昧あいまいさは申もうし訳わけありません。また、意見いけん、感想かんそう、批評ひひょうには全すべて目めを通とおさせております。伝つたわりにくい内容ないようやわかった事実じじつは適宜てきぎ編集へんしゅうしてできるだけ皆みなさんに伝つたわるよう善処ぜんしょいたしますのでどうぞよろしくお願ねがいします。追記ついき2ここまで追記ついき 2019/12/04　13:00 1.本番ほんばん環境かんきょうでやらかしちゃった人ひと Adv
監視かんしの考かんがえ方かた〜あるいは可か観測かんそく性せいとはなんなのか〜 - estie inside blog
- 270 users
- www.estie.jp
- テクノロジー
- 2023/02/15
みなさん、監かん視し作つくってますか？システムを作つくったら、そのシステムを監視かんししていく必要ひつようがありますよね。どうやったら「いい監視かんし」が作つくれるのでしょうか。「いい監視かんし」とそうでない監かん視しとの違ちがいとは、いったいなんでしょうか。今いまの時代じだい、「監視かんし」ではなくて「可か観測かんそく性せい」、 Observability (o11y) の時代じだいになっていて、良よいプラクティスや考かんがえ方かたが色々いろいろとあります。この記事きじは、監かん視しや o11y についての考かんがえ方かたを社内しゃないに共有きょうゆうするため書かいたものを、社外しゃがい共有きょうゆう用ように調整ちょうせいし直なおしたものです。新あたらしい Observability の時代じだいを、一緒いっしょに生いきていきましょう。監視かんしを作つくろうあなたはシステムを作つくりました。そのシステムに「監視かんし」をつけようと思おもったとき、最初さいしょにすることはなんでしょうか？まずは、システムを何なんらかのツールで監視かんしするところから始はじめましょう。やらなきゃはじまらない。 Nagios, Cacti, Mun
Google、SRE本ほんの第だい三さん弾だん「Building Secure and Reliable Systems」を無料むりょう公開こうかい
- 268 users
- www.publickey1.jp
- テクノロジー
- 2020/04/13
Google、SRE本ほんの第だい三さん弾だん「Building Secure and Reliable Systems」を無料むりょう公開こうかい GoogleはSite Reliability Engineering（SRE）に関連かんれんする書籍しょせきとして、これまで「Site Reliability Engineering」「The Site Reliability Workbook」の2冊さつを無料むりょうで公開こうかいしてきました。このSRE本ほんの第だい三さん弾だんとして、Googleは「Building Secure and Reliable Systems」の無料むりょう公開こうかいを開始かいししました。「Site Reliability Engineering」（SRE）とは、GoogleのシニアVPであるBen Treynor氏しが提唱ていしょうした、高たかい信頼しんらい性せいや性能せいのうを発揮はっきするシステムインフラを実現じつげんし、改善かいぜんしていくアプローチのひとつです。そしてこのアプローチは、前述ぜんじゅつの通とおり20
- SRE
- あとで読よむ
- google
- publickey
- 本ほん
- 無料むりょう
- インフラ
- 設計せっけい
- ebook
- book
独ひとりよがりのプラットフォーム / For Whom that Platform Runs
- 267 users
- speakerdeck.com/toricls
- テクノロジー
- 2020/09/09
Talked at CloudNative Days Tokyo 2020 #CNDT2020. Video available at https://event.cloudnativedays.jp/cndt2020/talks/30
Retty の Terraform CI/CD 解体かいたい新書しんしょ - Retty Tech Blog
- 266 users
- engineer.retty.me
- テクノロジー
- 2022/11/18
Retty インフラチームの幸田こうだです。 6月に実施じっししたマイクロサービス強化きょうか月間げっかんで公開こうかいした記事きじでは、マイクロサービス環境かんきょうを Terraform を利用りようして刷新さっしんした話はなしを書かきました。 engineer.retty.me この記事きじでは前回ぜんかいと重複じゅうふくする箇所かしょもありますが、Terraform の CI/CD にフォーカスした内容ないようを書かこうと思おもいます。 CI を整備せいびするにあたって意識いしきしたこと「誰だれでも」かつ「安全あんぜんに」利用りようできるように CI 上じょうですべての作業さぎょうを完結かんけつさせる Pull Request によるレビュー環境かんきょうの整備せいびバージョンアップ作業さぎょうの完全かんぜん自動じどう化か Terraform のディレクトリ構成こうせいについてリポジトリの運用うんようフロー Terraform によるリソースの追加ついか、変更へんこう、削除さくじょ tfmigrate によるステートファイルの操作そうさ CI で実行じっこうされる job について Pull Request をオープンした時とき P
- terraform
- CI
- あとで読よむ
- aws
- DevOps
- CICD
- cd
- 技術ぎじゅつ
- プログラミング